Gox语言使用比Go语言增强版的正则表达式-GX49

Gox语言支持Go语言标准库中的正则表达式处理包regexp,可以直接使用,使用上完全和Go语言中相同。另外,通过github.com/topxeq/regexpx包(通过github_topxeq_regexpx引用),还可以支持更复杂的正则表达式功能,如实际应用中有时候非常有用的后向引用、前向断言、后向断言等。

  • Gox语言1.20版本后内置支持github.com/topxeq/regexpx包。

另外,也可以简单使用tk包中与正则表达式相关的几个快捷函数,无需引用其他的包。

下面是一段代码例子:

// 设置github.com/topxeq/regexpx包的简称
regexp = github_topxeq_regexpx

// 编译正则表达式pattern,\k表示后向引用,本例中表示引用之前捕获过的第一个组
re := regexp.MustCompile(`^(\w)\w+\k{1}$`)

// 输出各个匹配的测试
fmt.Println(re.MatchString("acca"))
fmt.Println(re.MatchString("accccab"))
fmt.Println(re.MatchString("AA"))

// 不使用github.com/topxeq/regexpx包而直接使用tk包中的快捷函数
pl("found1: %v", tk.RegFindFirstX("abcde123456!#@e1abcdefg", `(e\d).*?\k{1}`, 0))

// (?![a-z])这是前向逆断言,表示寻找后面不紧跟这小写字母的
pl("found2: %v", tk.RegFindFirstX("abcde123456!#@e1abcdefg", `.e.(?![a-z])`, 0))

pass()

运行结果是:

D:\goprjs\src\github.com\topxeq\gox>gox -gopath regexpx
true
false
false
found: e123456!#@e1
found: de1

可以看到,运行结果都正常,最后一个匹配,“@e1”因为后面跟的是小写字母,因此不符合匹配条件,只有“de1”符合条件。

Gox支持的增强正则表达式功能还包括:

增强的几个非捕获组语法:

(?>re) 原子分组;非捕获组
(?=re) 前向断言;非捕获组
(?!re) 前向逆断言;非捕获组
(?<=re) 后向断言;非捕获组
(?<!re) 后向逆断言;非捕获组
(?{func}) 函数调用;非捕获组
(?#comment) 注释

高级重复:

x*+ 0或多个x;独占的
x++ 1或多个x;独占的
x?+ 0或1个x;独占的
x{n,m}+ n到m个x;独占的
x{n,}+ n个或更多x;独占的
x{n}+ 刚好n个x;独占的

后向引用:

\kN 引用第N个捕获组
\kName 引用命名的捕获组
\k{N} 引用第N个捕获组
\k{Name} 引用命名的捕获组(更安全)

后向断言的限制:后向断言和后向逆断言只支持确定长度的匹配。例如下面标OK的才是被支持的后向断言。

(?<=abc) // OK
(?<=.{2,5}) // OK
(?<=foo|barbaz) // OK
(?<=x+) // NG

注意:

  • Gox语言是脱胎于Go语言(Golang)的开源脚本语言,解释执行,但相比Go语言更贴近高级语言,语法硬性限制也少一些;是一门偏向快速应用的语言,也可以说是一个集成工具;

  • Gox语言主要优势有三点:

    • 第一,Gox语言本身只有一个可执行文件,绿色免配置,下载即可使用,无需安装Go语言环境,无需编译,非常适合快速制作原型以及云服务器上的远程开发;
    • 第二,Gox中可以直接使用绝大多数Go语言标准库中的对象和方法函数,也内置了很多常用、优秀的第三方库,充分发挥Go语言多年积累的资源优势;
    • 第三,与很多其他主流语言不同,Gox语言着力解决了GUI图形界面编程的问题,内置了基于Giu(imgui)、LCL、Sciter的三套图形界面编程库,直接可以进行快捷高效的图形界面开发(LCL、Sciter只需分别下载一个动态链接库文件,执行和分发时附带上即可),特别适合编写演示原型系统。

作为脚本语言,Gox语言性能肯定不如Go语言这样的编译型语言快,但由于Gox语言与Go语言的紧密联系,Gox语言编写的脚本可以很容易的改写成Go语言代码,编译执行后就可以发挥Go语言的速度优势了。因此,Gox语言也比较适合做初期的Go语言调试,还有一个更直接的方式是使用Gotx(在Gox官网上也有下载),这是使用完全和Go语言一样语法的解释器,可以理解成集成了Go语言标准库和不少第三方库的解释执行的Go语言,一样也不需要搭建Go语言环境。Gotx与Gox的区别在于,Gotx仍然遵循Go语言的文法,代码相对复杂一些,限制也多一些,但改写回Go语言准备编译执行时,基本上没有成本。

Gox的官网在这里,也可以在浏览器搜索引擎中直接搜索“gox语言”,Github页面在这里,在这里可以看到很多Gox语言的学习指南和实际应用实例。