《ANTLR 4权威指南》一3.2　测试生成的语法分析器-阿里云开发者社区

《ANTLR 4权威指南》一3.2　测试生成的语法分析器

2017-05-02 1565

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 对语法运行ANTLR之后，我们需要编译自动生成的Java源代码。简单起见，我们在工作目录/tmp/array下完成所有的编译操作。

本节书摘来自华章出版社《ANTLR 4权威指南》一书中的第3章，第3.2节，［美］　特恩斯·帕尔（Terence Parr）　著张　博　译，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.2　测试生成的语法分析器

对语法运行ANTLR之后，我们需要编译自动生成的Java源代码。简单起见，我们在工作目录/tmp/array下完成所有的编译操作。

如果编译器产生了一个ClassNotFoundException异常，说明你可能没有正确设置Java的CLASSPATH环境变量。在类UNIX系统上，你需要执行以下命令（也可以写在类似.bash_profile的启动脚本中）：

我们使用第1章提到的grun别名来启动TestRig，执行对语法的测试。下面的命令告诉我们如何将词法分析器生成的词法符号打印出来。

在输入要测试的语句{99, 3, 451}之后，我们必须手动输入一个EOF。默认情况下，ANTLR在开始处理前会加载全部的输入文本（这是最常见的情况，也是最有效率的处理方式）。
每行输出代表一个词法符号，其中包含该词法符号的全部信息。例如，[@5, 8:10 = '451', <4>, 1:8]表明它是第5个词法符号（从0开始计数），由第8到第10个字符组成（从0开始计数，包含第8和第10），包含的文本是451，类型是4（INT），位于输入文本的第1行（从1开始计数）第8个字符（从0开始计数，tab作为一个字符）处。注意，输出的结果中不包含空格和换行符，这是因为在我们的语法中，WS规则的“->skip”指令将它们丢弃了。
如果需要语法分析器关于输入文本识别过程的更多信息，我们可以使用“-tree”选项查看语法分析树：

“-tree”选项使用LISP风格（根节点和子节点在同一行显示）打印出语法分析树。另外，我们也可以使用“-gui”选项生成一个可视化的对话框。我们试着用这个选项处理一下{1, {2, 3}, 4}这样的嵌套结构。

图3-2就是弹出的包含语法分析树的对话框。
用自然语言表述，语法分析树就是，“输入的是一个由一对花括号包裹的三个值组成的初始化语句，第一个和第三个值是整数1和4，第二个值也是一个初始化语句，它由一对花括号包裹的两个值组成，这两个值是整数2和3”。
这些内部节点，即init节点和value节点，非常通俗易懂，因为它们用名字标识出了复杂的输入元素。这有点像是标识英语句子中的动词和主语。ANTLR最棒的部分在于，它能够基于我们的语法中的规则名自动创建这样的一棵语法分析树。在本章的最后，我们会使用ANTLR内置的语法分析树遍历器触发自定义的回调函数enterInit()和enterValue()，从而构建出一个满足要求的翻译器。