《Lua程序设计》之 字符串

四、 字符串

在Lua语言中,字符使用8个比特位来存储。优先考虑UTF-8编码,因为从Lua 5.3开始提供了一个帮助使用UTF-8编码的函数库。

要获取字符串的字符长度,使用 #
要连接字符串,使用连接符 ..

> a = 'Hello'
> #a
5
> a ..' world'
Hello world
4.1 字符串常量

字符串常量可以用双引号也可以用单引号,唯一的区别是,双引号中可以直接输入单引号,单引号中可以直接输入双引号而不需要转义

> a = "a line 'LION' wow"
> b = 'a row "ROW" gaga'
> a
a line 'LION' wow
> b
a row "ROW" gaga

Lua语言支持以下C语言风格的转移字符:

\a 响铃
\b 退格(back space)
\f 换页(form feed)
\n 换行(newline)
\r 回车(carriage return)
\t 水平制表符(horizontal tab)
\v 垂直制表符(vertical tab)
\\ 反斜杠(backslash)
\" 双引号(double quote)
\' 单引号(single quote)

从Lua 5.3开始,可以使用转义序列\u{h...h}来声明UTF-8字符,花括号中可以支持任意有效的十六进制

> "\u{3b1} \u{3b2} \u{3b3}"
α β γ
4.2 长字符串/多行字符串
> a = [[
>> 
>> Hello
>>  world!
>> I come from China!
>> ]]
> a

Hello
 world!
I come from China!

> a = [[
>> I show you a expression
>> a=b[c[i]]    --我还没输入完,就结束啦
> 

可以看到上面倒数第二行,如果出现这样的表达式包含了]],那我们就没法按预期一样的输入多行字符串,所以最好在[[加多个=号,如:

> a = [=[
>> I show you a expression
>> a=b[c[i]]
>> express end
>> ]=]
> a
I show you a expression
a=b[c[i]]
express end

> 

对注释而言,这种机制也同样有效,可以使用--[
=[和--]=]来进行长注释
Lua 5.2及其之后引入了转义序列\z,这个没太看懂???

4.3 强制类型转换

算数操作符会把字符串强制转换成数值,但比较操作符不会,连接操作符会把数值强制转换成字符串

  • tonumber函数

将一个字符串转换成数值,使用tonumber函数,当这个字符串的内容不能表示为有效数字时,返回nil;默认情况下,函数tonumber使用的是十进制,但也可以指明二进制到三十六进制之间的任意

> tonumber('23')
23
> tonumber('10010',2)
18
> tonumber('0x14',16)
nil
> tonumber('14',16)
20
> tonumber('-ZZ',16)
nil
> tonumber('-ZZ',36)
-1295
  • tostring函数
    将数值转换成字符串可用该函数,但是要注意转换后的长度,如:
> tostring(10.0)
10.0
> tostring(10.0) == '10'
false
> tostring(10)
10
> tostring(10) == '10'
true
  • 比较操作符

比较操作符不会进行强制转换,看例子

> 2 < "15"
stdin:1: attempt to compare number with string
stack traceback:
    stdin:1: in main chunk
    [C]: in ?
> "2" < "15"
false
> "2" > "15"
true
> "2" > "1"
true
> "4" > "15"
true

比较操作符检测到类型不一致时会抛异常,比较字符串的时候是以字符顺序,"two" > "fiftween"

4.4 字符串标准库

Lua语言解释器本身对字符串操作只限制于:创建、连接、比较、获取字符串的长度。其他的功能,如查找子字符串、替换字符串等来自字符串标准库。我们看下字符串标准库的功能。

> string.len('Hello')
5
> string.len('Hello') == #'Hello'
true
> string.rep('abc',3)  --返回字符串'abc',重复3次的结果
abcabcabc
> string.reverse('Hello')  --字符串翻转
olleH
> string.lower('Hello')
hello
> string.upper('Hello')
HELLO
> a = '[Hello]'
> string.sub(a,2,-2)
Hello
> string.char(97,98,100)
abd
> string.byte('Hello',2)
101
> string.byte('Hello')
72
> string.byte('Hello',2,3)
101 108
> string.format("x=0x%x",200)
x=0xc8
> string.format("x=%f",200)
x=200.000000
> string.format("x=%02d",5)
x=05
> string.format("x=%.2f",5.43654)
x=5.44
> string.find('Hello','ell')
2   4
> string.find('Hello 4 (world)','%a+%s*%d%s*%(%a+%)')
1   15
> string.gsub("Lua is cute", "cute", "great")
Lua is great    1

string.sub(s,i,j)从字符串s中提取第i个到第j个字符(包括第i个和第j个字符,字符串的第一个字符索引为1),该函数也支持负索引,-1代表字符串的最有一个字符。

string.char 接收0个或多个整数作为参数,然后将每个整数转换成对应的字符,最后返回由这些字符连接而成的字符串。

string.byte(s,j)返回字符串s中第i个字符的内部数值表示,该函数的第二个参数是可选的,若不填,则返回字符串s中第一个字符的内部数值。一种常见的写法{string.byte(s,1,-1)},该表达式会创建一个由字符串s中的所有字符代码组成的表。(Lua语言限制了栈大小,所以也限制了一个函数的返回值的最大个数,默认是最大为一百万。因此,这个技巧不能用于大小超过1MB的字符串)

string.format 进行字符串格式化和将数值输出为字符串的强大工具。格式化字符串的指示符:%s,%d,%x,%f,分别表示字符串、十进制、十六进制、浮点数。%.4f 指定浮点数保留小数位第4位,%02d 表示一个十进制数至少由两个数字组成,不足两个数字的用0补齐。详情可参考C语言的printf函数的相关文档,lua和其通用。

string.find 在指定的字符串中进行模式搜索,返回搜索到的开始位置和结束位置,否则返回nil

string.find 把所有的匹配模式用另一个字符串替换,第二个返回值是发生替换的次数

4.5 Unicode编码

这里只针对Lua 5.3及其以上版本。比较复杂,看不太懂?????

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 157,198评论 4 359
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,663评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 106,985评论 0 237
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,673评论 0 202
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 51,994评论 3 285
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,399评论 1 211
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,717评论 2 310
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,407评论 0 194
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,112评论 1 239
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,371评论 2 241
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,891评论 1 256
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,255评论 2 250
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,881评论 3 233
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,010评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,764评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,412评论 2 269
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,299评论 2 260

推荐阅读更多精彩内容

  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 4,306评论 0 5
  • 第5章 引用类型(返回首页) 本章内容 使用对象 创建并操作数组 理解基本的JavaScript类型 使用基本类型...
    大学一百阅读 3,148评论 0 4
  • 基础知识 Lua中的string和c#中相同,string类型的值一旦改变,便要为新值开辟空间,并指向此空间。也就...
    Charon_ted阅读 939评论 0 1
  •   引用类型的值(对象)是引用类型的一个实例。   在 ECMAscript 中,引用类型是一种数据结构,用于将数...
    霜天晓阅读 1,014评论 0 1
  • 我想要那个灯笼,当时几块钱,和那些十几的龙,凤,卡通神话人物的灯笼相比,我想要的那个水晶球灯笼,太普通了。我跪在地...
    随笔小纪阅读 412评论 0 0