Swift 中的字符串截取

由于种种原因,简书等第三方平台博客不再保证能够同步更新,欢迎移步 GitHub:https://github.com/kingcos/Perspective/。谢谢!

Substring in Swift 3.0

  • Info:
  • macOS 10.12.2 Beta
  • Xcode 8.2 Beta
  • Swift 3.0

前言

最近更文的频率也是越来越慢,除去已到期末的缘故,加上在忙老师的项目,自己的时间便被压缩殆尽。不过好在 Swift 设计模式基本上已经更新完毕,下来就准备补齐每个模式对应的说明。

在尝试使用 Swift 实现《大话设计模式》一书中的解释器模式时,书中的 Demo 多次使用了截取字符串的方法,当然,Swift 作为一门先进的编程语言不会缺少这一常用的方法。然而在使用中,可能由于 Swift 是一门较为注重(类型)安全的语言,其字符串截取方法使用方式与 Java 等编程语言便有一些语法上的不同。在 Swift 自身的迭代过程中,这部分的语法变化也很大。所以这次就来简单研究一下 Swift 中的字符串截取。需要注意的是,虽然 Swift 也可以使用 NSString 类型的字符串,而且两者可以很容易的桥接,但考虑到个人对 Objective-C 的了解程度,便暂时不探讨。

String.Index

Basics

索引与下标,即 index 和 subscript。一般来说,两者的概念是类似的,不过个人觉得索引有泛指的概念,而下标是具体的。

Swift 中字符串的索引类型并不是其他语言中的整型(int),而是 String.Index。String.Index,即标注字符串的索引类型。在 Swift 的标准库中,可以看到其本质是 String.CharacterView.Index 的别名。

/// The index type for subscripting a string.
public typealias Index = String.CharacterView.Index

再进一步查看 String.CharacterView,即创建给定字符串的字符视图类型。

public struct CharacterView {

    /// Creates a view of the given string.
    public init(_ text: String)
}

常用的 "maimieng.com".characters 的类型其实就是 String.CharacterView 类型。.characters 将字符串内容转化为字符序列的视图。

start & end

字符串必然是一个字符的有限序列,Swift 为了方便开发者迅速定位,便集成了 startIndexendIndex。但是需要注意的是:startIndex 是指字符串的第一个字符的下标,而 endIndex 是指字符串的最后一个字符之后的下标。当字符串为空时,startIndexendIndex 相同。

var str = "maimieng.com"

print(str.characters.count)

print(str.startIndex)
print(str.endIndex)

// 12
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 0), _countUTF16: 1)
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)

从上面的 Demo 也可以看出,startIndex 的位置为 0,而 endIndex 的位置为 12,等同于字符串的长度,而不是字符串长度减一。

除了给出了起始和结尾的下标,Swift 也提供了根据下标定位其他索引的方法:

public func index(after i: String.Index) -> String.Index
public func index(before i: String.Index) -> String.Index

public func index(_ i: String.Index, offsetBy n: String.IndexDistance) -> String.Index
public func index(_ i: String.Index, offsetBy n: String.IndexDistance, limitedBy limit: String.Index) -> String.Index?

这样就可以通过给出的 startIndexendIndex 来定位到其他的下标了。

var str = "maimieng.com"

// 返回传入下标之后的下标
print(str.index(after: str.startIndex))
// 返回传入下标之前的下标
print(str.index(before: str.endIndex))

// 返回传入下标偏移后的下标(偏移量可正可负可为 0)
print(str.index(str.startIndex, offsetBy: 1))

// print(str.index(str.endIndex, offsetBy: 10))
// 作用同上,但如果超过传入的界限返回 nil
print(str.index(str.endIndex, offsetBy: 10, limitedBy: str.endIndex) ?? "越界")

下标之间的间距,也可以利用 func distance(from start: String.Index, to end: String.Index) -> String.IndexDistance 方法求出:

var str = "maimieng.com"

print(str.distance(from: str.startIndex, to: str.endIndex))
// 12
print(str.distance(from: str.endIndex, to: str.startIndex))
// -12

Range

Range 即范围,Swift 中实现了 Comparable 协议的类型都可以用 Range 来表示范围。以下的 Range 特指:Range<String.Index>

Range 的构造方法是 init(uncheckedBounds bounds: (lower: Bound, upper: Bound))。即传入一个元组,返回一个范围。需要注意的是:这个范围 Swift 是不会检查的,需要程序员自觉维护。

var str = "maimieng.com"

// 前闭后开
let rangeA = Range(uncheckedBounds: (str.startIndex, str.endIndex))
print(rangeA)
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 0), _countUTF16: 1)..<Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)

print(str.substring(with: rangeA))
// maimieng.com

// 即使范围首尾颠倒,也没有报错
let rangeB = Range(uncheckedBounds: (str.endIndex, str.startIndex))
print(rangeB)
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)..<Index(_base: Swift.String.UnicodeScalarView.Index(_position: 0), _countUTF16: 1)
// 但在使用中会出错
// fatal error: Can't form Range with upperBound < lowerBound
// str.substring(with: rangeB)

在上面的 Demo 中,从输出中也可以看出,init(uncheckedBounds bounds: (lower: Bound, upper: Bound)) 构造的范围是一个前闭后开的区间。

Swift 中,字符串本身也能构造出 Range,例如:得到字符串子串的范围,若不存在则返回 nil:

var str = "maimieng.com"

// 返回前闭后开的范围
print(str.range(of: ".com") ?? "不存在")
// Index(_base: Swift.String.UnicodeScalarView.Index(_position: 8), _countUTF16: 1)..<Index(_base: Swift.String.UnicodeScalarView.Index(_position: 12), _countUTF16: 0)

substring

在 Range 一节的 Demo 中,已经使用了 substring(with:) 方法测试范围的使用。Swift 中的字符串截取与其他语言其实是相似的,都是根据索引或索引范围来截取,只是 Swift 中的索引的类型不是整型,稍有麻烦。

var str = "maimieng.com"

// 截取传入范围(左开右闭)的子串
let range = Range(uncheckedBounds: (str.startIndex, str.endIndex))
print(str.substring(with: range))

// 从传入的索引开始截取到末尾(含 str.startIndex 元素)
print(str.substring(from: str.startIndex))
// 从传入的索引的前一个位置开始截取到头部(不含 str.endIndex 元素)
print(str.substring(to: str.endIndex))

// maimieng.com
// maimieng.com
// maimieng.com

以上的 Demo 便是 Swift 中最基本的截取字符串使用。然而有时候条件一多,代码的重复率也会增加,那么可以利用 Swift 中的 extension 来扩展原有的 String,让 Swift 的 String 可以像 C#、Java 一样截取字符串,需要注意的是 这里的 IndexDistance 实际上是 String.CharacterView.IndexDistance 的别名,而 String.CharacterView.IndexDistance 又是 Int 类型的别名。

extension String {
    func substring(from: IndexDistance) -> String? {
        let index = self.index(self.startIndex, offsetBy: from)
        return str.substring(from: index)
    }
    
    func substring(to: IndexDistance) -> String? {
        let index = self.index(self.startIndex, offsetBy: to + 1)
        return str.substring(to: index)
    }
    
    func substring(with range: Range<IndexDistance>) -> String? {
        let lower = self.index(self.startIndex, offsetBy: range.lowerBound)
        let upper = self.index(self.startIndex, offsetBy: range.upperBound)
        let range = Range(uncheckedBounds: (lower, upper))
        return str.substring(with: range)
    }
    
    func substring(_ lower: IndexDistance, _ range: IndexDistance) -> String? {
        let lowerIndex = self.index(self.startIndex, offsetBy: lower)
        let upperIndex = self.index(lowerIndex, offsetBy: range)
        let range = Range(uncheckedBounds: (lowerIndex, upperIndex))
        return str.substring(with: range)
    }
}

print(str.substring(to: 0) ?? "nil")
print(str.substring(from: 2) ?? "nil")
print(str.substring(with: 0..<1) ?? "nil")
print(str.substring(1, 2) ?? "nil")

// m
// imieng.com
// m
// ai

参考资料

Documentation & API Reference

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,233评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,013评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,030评论 0 241
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,827评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,221评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,542评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,814评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,513评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,225评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,497评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,998评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,342评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,986评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,812评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,560评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,461评论 2 266

推荐阅读更多精彩内容