《ANTLR 4权威指南 》一第一部分 Part 1

简介: 在本书的第一部分中,我们的目标是大体上知道ANTLR能做什么。除此之外,我们还希望探究语言类应用程序的架构。在概览之后的第2章中,我们将会通过许多真实的例子来循序渐进地、系统性地学习ANTLR。

本节书摘来自华章出版社《ANTLR 4权威指南 》一书中的第1章,第1.1节,[美] 特恩斯·帕尔(Terence Parr) 著
张 博 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第一部分 Part 1

ANTLR

1ANTLR
2
3ANTLR
4

在第一部分中,我们会安装ANTLR,尝试通过它来识别一个简单的“hello world”语法,并概览语言类应用程序的开发过程。在此基础上,我们会构造一个语法来识别和翻译形如{1,2,3}的花括号中的一列整数。最后,我们将通过一系列的简单语法和程序来快速了解ANTLR的特性。

第1章

初识ANTLR

在本书的第一部分中,我们的目标是大体上知道ANTLR能做什么。除此之外,我们还希望探究语言类应用程序的架构。在概览之后的第2章中,我们将会通过许多真实的例子来循序渐进地、系统性地学习ANTLR。在开始之前,我们需要首先安装ANTLR,然后尝试用它编写一份简单的“hello world”语法。

1.1 安装ANTLR

ANTLR是用Java编写的,因此你需要首先安装Java,哪怕你的目标是使用ANTLR来生成其他语言(如C#和C++)的解析器。(我希望在不远的未来ANTLR可以支持更多语言。)ANTLR运行所需的Java版本为1.6或更高。

<div style="text-align: center">
 <img src="https://yqfile.alicdn.com/78b8b3bf587a3e0231cfac271bdd3e247904edde.png" >
</div>
<br/>

安装ANTLR本身仅仅需要下载最新的jar包(例如antlr-4.0-complete.jar),然后把它放在合适的位置。该jar包包含了运行ANTLR的工具和编译、执行ANTLR产生的识别程序所依赖的全部运行库。它们有何区别呢?简而言之,ANTLR工具将语法文件转换成可以识别该语法文件所描述的语言的程序。例如,给定一个识别JSON的语法,ANTLR工具将会根据该语法生成一个程序,此程序可以通过ANTLR运行库来识别输入的JSON。
上述jar包还包含两个用于提供相关支持的库:一个复杂的树形结构生成库和StringTemplate,这一个用于生成代码和其他结构化文本的优秀的模板引擎。在ANTLR 4.0中,语法本身是通过ANTLR 3来识别的,所以上述完整版的jar包还包含ANTLR的早期版本。

<div style="text-align: center">
 <img src="https://yqfile.alicdn.com/0035e758e79bf548c275bbda7d9435ed331c5dad.png" >
</div>
<br/>

你可以通过浏览器从ANTLR的网站下载ANTLR,或者使用命令行工具curl:
q1
在UNIX上,/usr/local/lib非常适于存放jar包。在Windows上,似乎没有标准的存放jar包的目录,因此你可以简单地将它放在项目文件夹下。大多数开发环境要求你将jar包放在你的语言类应用程序的依赖列表中。不需要修改配置脚本或者配置文件之类的东西——你只需要保证Java能够找到这个jar包即可。
因为本书使用的是命令行,你需要担负设置CLASSPATH环境变量的重任。通过设置好的CLASSPATH环境变量,Java就能够找到ANTLR工具和运行库。在UNIX系统上,你可以手动执行以下命令或者将其添加到启动脚本中(对于bash命令行,就是.bash_profile):
q2

注意,CLASSPATH中的点非常关键,它代表当前目录。没有它,Java编译器和Java虚拟机就无法加载当前目录的class文件。在本书中,所有的编译和测试都是在当前目录中进行的。
有两种方式可以检查ANTLR的安装是否正确,第一种是通过不带参数的ANTLR命令行工具,第二种是通过java -jar来直接运行ANTLR的jar包或者直接调用org.antlr.v4.Tool类。
q3
每次都手动输入这些java命令是一件令人痛苦的事情,所以最好通过别名(alias)或者shell脚本的方式。本书接下来将会使用名为antlr4的别名,在类UNIX系统上的定义如下:
q4
此外,也可以将上述命令写入/usr/local/bin。
q5
在Windows上,可以通过如下批处理命令(假设ANTLR的jar包已经被放置在C:libraries)实现:
q6
不管用哪种方法,现在我们可以直接使用antlr4命令了。
q7
如果你看到了和上面一样的帮助信息,证明一切就绪,可以开始接下来的ANTLR之旅了!

相关文章
|
XML JSON 自然语言处理
《ANTLR 4权威指南 》一导读
ANTLR是一款强大的语法分析器生成工具,可用于读取、处理、执行和翻译结构化的文本或二进制文件。它被广泛应用于学术领域和工业生产实践,是众多语言、工具和框架的基石。
9879 0
|
分布式计算 Spark Java
Spark 2.4.0 编程指南--快速入门
## 技能标签 - Spark 2.4.0 Spark session available as 'spark' - 在Spark 2.0之后,RDD被数据集(Dataset)取代 - Spark session 读取HDFS文件做为数据集 - 数据集函数,count(),first(),...
1927 0
|
分布式计算 Spark
《Spark 官方文档》Spark编程指南
转自:http://ifeve.com/%E3%80%8Aspark-%E5%AE%98%E6%96%B9%E6%96%87%E6%A1%A3%E3%80%8Bspark%E7%BC%96%E7%A8%8B%E6%8C%87%E5%8D%97/ ...
688 0
|
消息中间件 JSON NoSQL
|
缓存 分布式计算 调度
Spark源码阅读笔记一——part of core
spark core的部分阅读笔记,持续更新中
1506 0
|
自然语言处理
《ANTLR 4权威指南 》一2.3 你再也不能往核反应堆多加水了
歧义性语句是指存在不止一种语义的语句。换句话说,歧义性语句中的单词序列能够匹配多种语法结构。本节的标题“你再也不能往核反应堆多加水了”就是我在几年前的《周六夜现场》中看到的一个有歧义的句子。这句话让人不确定,是已经无法往核反应堆多加水了,还是不应该往核反应堆多加水。
1656 0