Swift字符串截取与Range使用

开发语言:Swift 4.2
开发环境:Xcode 10.1

在Swift中,有一套全新的截取字符串的方式

首先,我们要先熟悉以下两个类型

1、String.Index

String.Index表示一个位置,使用String与String.Index可以获取该位置的Character

let str = "123456789"

let zero = String.Index.init(encodedOffset: 0)
let five = String.Index.init(encodedOffset: 5)
        
print(str[zero]) //输出 1
print(str[five]) //输出 6

如上所示,我们构造了两个String.Index,分别表示String的第1个Character和第6个Character,
随后,使用这两个String.Index也输出了str的对应位置的Character。

但实际使用中我们往往不会手动构造String.Index,取而代之的是以下方法。

  • startIndex : 表示字符串开始位置
  • endIndex :表示字符串结束位置
let str = "123456789"
let start = str.startIndex//表示str的开始位置
let end = str.endIndex//表示str的结束位置
let startOffset = str.index(start, offsetBy: 2)//表示str的开始位置 + 2
let endOffset = str.index(end, offsetBy: -2)//表示str的结束位置 - 2
        
print(str[start])//输出 1 第1个字符
print(str[startOffset])//输出 3 第3个字符
print(str[endOffset])//输出 8 第8个字符(10-2)
print(str[end])//报错!因为实endIndex指向第10个字符,而第10个字符是不存在的

神奇的是,我们使用上面方法构造的String.Index,可以提供给任意一个String使用,而非只能用于构造它的String

let foo = "abcde"
 
print(foo[start])//输出 a 第1个字符
print(foo[startOffset])//输出 c 第3个字符
print(foo[endOffset])//报错!期望输出第8个字符,越界
print(foo[end])//报错!同上

可见,String.Index是独立于String存在的,用于获取或者表示某个Character位置的类型

2、Range<T>

Range<T> 表示一个T类型的范围,以下使用Range<Int>依次说明Range的几种构造方式和用法

let range1:ClosedRange = 1 ... 4
let range2:CountableClosedRange = 1 ... 4
let range3:Range = 1 ..< 4
let range4:CountableRange = 1 ..< 4
        
let array = ["a", "b", "c", "d", "e", "f"]
print(array[range1])
print(array[range2])
print(array[range3])
print(array[range4])

输出:
["b", "c", "d", "e"]
["b", "c", "d", "e"]
["b", "c", "d"]
["b", "c", "d"]

我们可以使用lowerBound和upperBound来访问Range的起始位置和结束位置,注意无论是闭区间或半开区间,他们的upperBound的位置是一样的。

let array = ["a", "b", "c", "d", "e", "f"]
let range1:ClosedRange = 1 ... 4
let range3:Range = 1 ..< 4

print(range1.lowerBound)
print(array[range1.lowerBound])
print(range1.upperBound)
print(array[range1.upperBound])
print(range3.upperBound)
print(array[range3.upperBound])

输出:
1
b
4
e
4
e

我们建立了四种不同类型的Range,分别为ClosedRange,CountableClosedRange,Range,CountableRange。
其中前两个为闭区间,后两个半开区间。

  • 注意,以半开区间为例,有Range和CountableRange两个版本
  • 区别在于,Range为不可计数的,即不能用于循环来获取Range内的值
  • 但是在笔者使用的版本(Swift4.2)中, CountableRange被重新定义,与Range无异,两者均可计数
 public typealias CountableRange<Bound> = Range<Bound>

同时,Swift4.0又新增了单侧区间的概念,具体如下

let range1:PartialRangeThrough = ...4 
let range2:PartialRangeFrom = 1... 
let range3:PartialRangeUpTo = ..<4 

let array = ["a", "b", "c", "d", "e", "f"]
print(array[range1])
print(array[range2])
print(array[range3])

输出:
["a", "b", "c", "d", "e"] //start~下标4(包括4)
["b", "c", "d", "e", "f"] //下标1~end
["a", "b", "c", "d"] //start~下标4(不包括4)

对于单侧区间,lowerBound和upperBound也只有一半,例如上例中的range1和rang3只有upperBound,range2只有lowerBound。

3、Range<String.Index>

上一节我们介绍了Range是描述一个范围的类型,同样也构造了多种不同的Range<Int>来获取数组的值,但Range<Int>不能用来获取String的某一部分的值,想要获取String的某一部分的值,我们需要用到的是Range<String.Index>

下面我们使用3个String.Index构造5个不同的类型的Range<String.Index>,然后使用String[range]来截取字符串。

let str = "123456789"
        
let index1 = String.Index.init(encodedOffset: 1)
let index5 = String.Index.init(encodedOffset: 5)
let index7 = String.Index.init(encodedOffset: 7)
        
let range1:ClosedRange = index1 ... index5
let range2:Range = index5 ..< index7
let range3:PartialRangeThrough = ...index5
let range4:PartialRangeFrom = index1...
let range5:PartialRangeUpTo = ..<index7
        
print(str[range1])
print(str[range2])
print(str[range3])
print(str[range4])
print(str[range5])

输出:
23456 //下标1~下标5(包括5)
67 //下标5~下标7(不包括7)
123456 //start~下标5(包括5)
23456789 //下标1~end
1234567 //start~下标7(不包括7)

  • 注意,String[range]的返回类型为String.SubSequence,表示返回的是原string的子集,两者的内存是一样的。
  • 想要获取一份新的string需要使用以下方法
let subStr = str[range1] //String.SubSequence
let newStr = String(str[range1])//String

使用Range<String.Index>可以轻松的截取一个String,但现实使用往往需要在一个String中查找或者截取另一个String的位置。
遇到这样的需求,我们可以使用如下方法

let str = "123456789"
        
guard let range = str.range(of: "4567") else {
    return
}
        
print(str[..<range.lowerBound])
print(str[range.upperBound...])
print(str.prefix(upTo: range.lowerBound))
print(str.suffix(from: range.upperBound))

输出:
123 //截取4567前面的部分
89 //截取4567后面的部分
123 //效果与..<range.lowerBound一样,截取range.lowerBound前面的部分
89 //效果与range.upperBound...一样,截取range.upperBound后面的部分

推荐阅读更多精彩内容