使用Go播放音频:合成波形

原文地址:https://dylanmeeus.github.io/posts/audio-from-scratch-pt8/

在之前的文章中我们首先研究了如何用“原始”浮点数生成正弦波并使用ffplay对其进行解析。后来,我们探讨了如何读取/写入.wave文件以及如何使用断点提取以及创建“自动化轨道”。

你可能已经注意到,我们从未真正使用自己的声音数据从头开始创建.wave文件。现在该改变它了。在此文中,我们将研究如何创建各种基本声波。

本文的代码可以在Github示例中找到,也可以作为GoAudio库的一部分找到。

构造一个振荡器

振荡器是一种产生周期性(振荡)信号的设备(在我们的场景下是一段代码)。正弦波就是这种波形的一个例子,但我们还将介绍方波,三角波和锯齿波。

在本文的结尾,您将能够生成如下所示的信号:

image

在图像上,它们看起来像连接的线,但是在我们将生成的数字音频信号中,它们是单独的数据点。每个周期有几个“点”?这取决于我们使用的采样率。

我们可以弄清楚在给定的情况下如何找到sample rate。请记住,我们在trig函数中使用了弧度,因此周期定义为:2 * PI。要知道如何放置点,我们可以找出难点的一部分(“增量”),如下所示:

increment = (2 * PI) / SampleRate

不幸的是,这还不是全部。我们也要记住,我们的波具有一定的频率-我们必须在增量中加以考虑。实际功能将变为:

increment = ((2 * PI) / SampleRate) * freq

Oscillator中,我们必须跟踪这些东西。我们想知道当前频率是多少,当前相位是什么,以及如何增加该相位以获得波的下一个值。

这仅解决了部分难题。现在也很清楚,我们需要一种方法来区分用户想要生成哪种波形。为此,我们可以从Shape类型的“枚举”开始。每个形状也需要以不同的方式进行计算,因此我们可以将Shape与计算函数相关联shapeCalcFunc = map[Shape]func(float64)float64

type Shape int

const (
    SINE Shape = iota
    SQUARE
    DOWNWARD_SAWTOOTH
    UPWARD_SAWTOOTH
    TRIANGLE
)

var (
    shapeCalcFunc = map[Shape]func(float64) float64{
        SINE:              sineCalc,
        SQUARE:            squareCalc,
        TRIANGLE:          triangleCalc,
        DOWNWARD_SAWTOOTH: downSawtoothCalc,
        UPWARD_SAWTOOTH:   upwSawtoothCalc,
    }
)

这些是我们的“基本”形状,将在接下来的几篇文章中使用。尽管我将继续介绍它们,但它们将为我们提供坚实的基础。

将刚刚提到的这些放在一起,我们可以定义一个Oscillator结构体:


type Oscillator struct {
    curfreq  float64
    curphase float64
    incr     float64
    twopiosr float64 // (2*PI) / samplerate
    tickfunc func(float64) float64
}

// NewOscillator set to a given sample rate
func NewOscillator(sr int, shape Shape) (*Oscillator, error) {
    cf, ok := shapeCalcFunc[shape]
    if !ok {
        return nil, fmt.Errorf("Shape type %v not supported", shape)
    }
    return &Oscillator{
        twopiosr: tau / float64(sr), // (2 * PI) / SampleRate
        tickfunc: cf,
    }, nil
}

|

请注意,我们将twopiosr = tau / SampleRate = (2 * PI) / SampleRate存储为结构体变量。我们将在几个函数中使用它。

产生波形

有了这个构造函数,我们就有了一个工作振荡器的基础,但是它还没有产生任何东西。为此,我们需要一个函数,要求振荡器产生波的下一个值(它可以无限期地执行此操作)。此功能需要做一些事情:

  • 接受波产生的频率
  • 调整帧之间的增量
  • 在此相位找到值
  • 调整当前相位
  • 对相位进行一些边界检查(可选)

我们在Go中的功能变为:

func (o *Oscillator) Tick(freq float64) float64 {
    if o.curfreq != freq {
        o.curfreq = freq
        o.incr = o.twopiosr * freq
    }
    val := o.tickfunc(o.curphase)
    o.curphase += o.incr
        
        // adjust bounds
    if o.curphase >= tau {
        o.curphase -= tau
    }
    if o.curphase < 0 {
        o.curphase = tau
    }
    return val
}

对我们当前阶段的调整是将其保持在边界内(尽管根据sin函数的实现,这可能不是必需的,我仍做保留,但我敢肯定在Go中是不必要的)。

波形函数

剩下要实现的唯一部分是不同形状的波形的实际生成。这就是val := o.tickfunc(o.curphase)调用中发生的情况。通过使用通用函数调用,我们可以在对NewOscillator()的调用中注入正确的计算函数。

最容易实现的是正弦波。

func sineCalc(phase float64) float64 {
    return math.Sin(phase)
}

最简单的实现方式可能是方波函数。在这种情况下,我们1的一半是,另一半是-1

func squareCalc(phase float64) float64 {
    val := -1.0
    if phase <= math.Pi {
        val = 1.0
    }
    return val
}

三角波是第一个看起来更复杂的波,锯齿波与之相关(可以从视觉上看到锯齿成为三角形的一部分,并且具有陡峭的截止点。

func triangleCalc(phase float64) float64 {
    val := 2.0*(phase*(1.0/tau)) - 1.0
    if val < 0.0 {
        val = -val
    }
    val = 2.0 * (val - 0.5)
    return val
}

func upwSawtoothCalc(phase float64) float64 {
    val := 2.0*(phase*(1.0/tau)) - 1.0
    return val
}

func downSawtoothCalc(phase float64) float64 {
    val := 1.0 - 2.0*(phase*(1.0/tau))
    return val
}

生成波

设置好振荡器后,我们终于可以开始使用它了。以下所有代码都包含在此GoAudio示例中。

func main() {
    flag.Parse()
    fmt.Println("usage: go run main -d {dur} -s {shape} -a {amps} -f {freqs} -o {output}")
    if output == nil {
        panic("please provide an output file")
    }

    wfmt := wave.NewWaveFmt(1, 1, 44100, 16, nil)
    amps, err := ioutil.ReadFile(*amppoints)
    if err != nil {
        panic(err)
    }
    ampPoints, err := breakpoint.ParseBreakpoints(bytes.NewReader(amps))
    if err != nil {
        panic(err)
    }
    ampStream, err := breakpoint.NewBreakpointStream(ampPoints, wfmt.SampleRate)

    freqs, err := ioutil.ReadFile(*freqpoints)
    if err != nil {
        panic(err)
    }
    freqPoints, err := breakpoint.ParseBreakpoints(bytes.NewReader(freqs))
    if err != nil {
        panic(err)
    }
    freqStream, err := breakpoint.NewBreakpointStream(freqPoints, wfmt.SampleRate)
    if err != nil {
        panic(err)
    }
    // create wave file sampled at 44.1Khz w/ 16-bit frames

    frames := generate(*duration, stringToShape[*shape], ampStream, freqStream, wfmt)
    wave.WriteFrames(frames, wfmt, *output)
    fmt.Println("done")
}

注意,我们还打印了用法,这告诉我们持续时间,形状,幅度断点,频率断点,最后是输出文件。“繁重的工作”发生在对generate 的调用中。在这里,我们传递持续时间,从CLI上输入的字符串派生的Shape实例,我们的断点以及最后一个WaveFmt。请记住,WaveFmt结构包含我们正在生成.wave的文件的元数据。在这种情况下,wave.NewWaveFmt(1, 1, 44100, 16, nil)表示这是一个标准PCM波形文件,在44.1Khz上播放1个通道(单声道),其中数据由16位浮点数组成。你可以使用这些值来查看结果如何变化。

最后,在generate函数中,我们需要计算需要生成的样本数量(=单帧)。然后,我们将调用Tick振荡器的函数以及断点流,以连续获取下一个值。

func generate(dur int, shape synth.Shape, ampStream, freqStream *breakpoint.BreakpointStream, wfmt wave.WaveFmt) []wave.Frame {
    reqFrames := dur * wfmt.SampleRate
    frames := make([]wave.Frame, reqFrames)
    osc, err := synth.NewOscillator(wfmt.SampleRate, shape)
    if err != nil {
        panic(err)
    }

    for i := range frames {
        amp := ampStream.Tick()
        freq := freqStream.Tick()
        frames[i] = wave.Frame(amp * osc.Tick(freq))
    }

    return frames
}

到这里,我们现在已经拥有所有用于生成基本波形的代码。当检查它们时,我们将得到在本文开头显示的结果。

改进之处

这样我们就可以生成基本的“干净”的音频信号,这对于测试目的可能是方便的,但是据我所知也就到此为止了。(大多数软件合成器也可以让你体验这些类型的wave,但是你可以将它们调整为更有用的功能)。

你可能对此代码有些担心,首先是性能问题。根据定义,振荡器是重复的,但我们一直在计算“下一阶段”。这是绝对必要的吗?不,我们实际上可以将期望看到的值存储在“查找表”中。

在下一篇文章中,我们将研究如何使用查找表,我们还将开始考虑谐波,以更真实的方式表示声音。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,015评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,262评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,727评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,986评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,363评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,610评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,871评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,582评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,297评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,551评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,053评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,385评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,035评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,079评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,841评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,648评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,550评论 2 270