为Python添加中文关键字

program-in-chinese 2018-01-06 原文

2 个月前

原址: https://zhuanlan.zhihu.com/p/31159526

1. 大部分语法，可以按下面方法加同义的中文token
第1步. 编译pgen
cd到python的源代码目录下，

./configure
make Parser/pgen

第2步. 修改 ./Grammar/Grammar，添加同义词并生成语法代码。

以while，else为例
原文：

while_stmt: 'while' test ':' suite ['else' ':' suite]

改为：

while_stmt: ('while'|当) test ':' suite [('else'|另) ':' suite]

保存 ./Grammar/Grammar为UTF-8格式

执行

./Parser/pgen ./Grammar/Grammar ./Include/graminit.h ./Python/graminit.c

虽然会提示错误，但输出是有效正确的。

其实pgen不支持UTF-8，这里中文名不需要用单引号或双引号，利用pgen的容错性，减少工作量。

2. 还有一较复杂语法在/Python/ast.c 里有辅助解析

例如

comp_op: ... |'in'|'not' 'in'|'is'|'is' 'not'

改为

comp_op: ... |('in'|在)|('not' 'in'|不在)|('is'|为)|('is' 'not'|不为)

在ast.c里的 ast_for_comp_op 中

if (NCH(n) == 1)
 switch (TYPE(n))
     case NAME:
/******添加如下代码*******/
         if (strcmp(STR(n), "在") == 0) 
              return In;
         if (strcmp(STR(n), "不在") == 0) 
               return NotIn;
         if (strcmp(STR(n), "为") == 0) 
               return Is;
         if (strcmp(STR(n), "不为") == 0) 
               return IsNot;

其实从源代码我们可以看出来，comp_op原来的判断是token有两个单词的话，第二个单词为in返回NotIn，第一个单词为is返回IsNot。

另外就是 None，True，False，finally，async，await 需要添加一下。

3.内置函数中文化

在/Python/bltinmodule.c中的builtin_methods[]中添加

以print为例，将含”print”的一行复制粘贴，替换第二行的”print”为”打印”即可

  {"print",           (PyCFunction)builtin_print,      METH_FASTCALL | METH_KEYWORDS, print_doc},
   {"打印",           (PyCFunction)builtin_print,      METH_FASTCALL | METH_KEYWORDS, print_doc},

其他的还有一些宏，展开看一下，就明白了。

  BUILTIN_LEN_METHODDEF
   {"长", (PyCFunction)builtin_len, METH_O, builtin_len__doc__},

之后 make 编译python即可。

中文的py文件也需要保存为UTF-8格式。

本文链接：https://www.cnblogs.com/program-in-chinese/p/8213260.html

为Python添加中文关键字的更多相关文章

中文编程语言之Z语言初尝试: ZLOGO 4

原文: https://zhuanlan.zhihu.com/p/31505895. 作者为本人. @TK […]...

中文编程专栏月报：2017年11月

之前Github讨论组有周报，但效果一般。从周报停更/知乎专栏创建到现在一个月，特此做一小结。也包含了gith […]...

中英文代码对比系列之Java一例

原文: https://zhuanlan.zhihu.com/p/30905033. 作者为本人. 这个系列将 […]...

随机推荐

快排的实现及快排的排序效率测试

/** * 排序之快速排序【该类中写的都是没有优化的版本。】 * 1. 实现： * ①找基准点：第一个元素； […]...

使用pscp命令在Windows与linux之间拷贝文件

在Linux环境下做开发时，我们可能会在windows下远程控制Linux系统，本文介绍如何使用putty的p […]...

Andorid 11获取外部存储权限方法

private void requestmanageexternalstorage_Permission() {if (Build.VERSION.SDK_INT >= Build.VERSION_CODES.R) {// 先判断有没有权限...

【JAVA8新的时间与日期 API】- 传统时间格式化的线程安全问题

Java8之前的日期和时间API，存在一些问题，最重要的就是线程安全的问题。这些问题都在Java8中的日期和时 […]...

layoutParams-动态更改某个控件的margin

动态更改控件在父容器中的位置其实它的方法也非常的简单，如下 LinearLayout.LayoutParam […]...

简单的获取验证码

<!DOCTYPE html><html> <head> <meta […]...

中国500家企业【薪资待遇】一览

快消类：联合利华： MKT 9500+3000元安家费普通职位 8KX12 联合利华销售代表：底薪加提成， […]...

测试 – 测试方法

目录 before 黑、白、灰盒测试白盒测试黑盒测试灰盒测试黑、白、灰盒测试方法总结静态、动态测试 […]...

为Python添加中文关键字

为Python添加中文关键字的更多相关文章

随机推荐

热门专题

目录导航