动手自制一个GPT对话软件(免费的GPT API、免费的语音文字互转)

最近我有一个想法,因为看到GPT非常火爆,甚至GPT4已经能够实现语音对话的应用。但是在国内由于某些原因,我们无法使用GPT。即便通过特殊方式可以使用,GPT4的成本也相当高昂。
如果我们掌握了一些前后端编程技术,只要有一个GPT的API,我们就可以开发出GPT的应用。这样不仅可以实现语音转文字,还能帮助我们实现一些非常酷炫的功能。

(0) 引言

假设我们要开发一个基于GPT的语音对话机器人,其实现流程包括:前端录制语音 -> 发送语音至后端 -> 后端将语音转换成文本 -> 将文本发送至GPT API -> 接收GPT API的响应并将其转换成语音 -> 最后将语音反馈至前端
关键步骤主要包括:

  • 获取免费的GPT API接口及其使用方法
  • 实现免费的文本到语音及语音到文本的转换功能

(1)免费的GPT API接口

openAI(不是,close AI)有提供API的文档,但是这个接口是需要付费的,而且是按照token进行付费。我们需要对API Key进行充值后才能使用,我想这不是我想要的,当然富豪随意。模型(Model) | OpenAI 官方帮助文档中文版 (xiniushu.com)这里我也给出链接,随意选取。
最后还是发现了这个API:GitHub - chatanywhere/GPT_API_free: Free ChatGPT API Key,免费ChatGPT API,支持GPT4 API(免费),ChatGPT国内可用免费转发API,直连无需代理。可以搭配ChatBox等软件/插件使用,极大降低接口使用成本。国内即可无限制畅快聊天。
免费API Key限制150请求/24小时。我觉得就是普通用户使用也算是足够了。如果你是商用肯定就是付费了,即使是付费内容,我认为也是较为亲民的。其使用方法和openai的API的使用方式是一样的。

给一个python的代码示例吧:

from openai import OpenAI

client = OpenAI(
    # defaults to os.environ.get("OPENAI_API_KEY")
    api_key="YOUR API KEY",
    base_url="https://api.chatanywhere.tech/v1"
)



# 非流式响应
def gpt_35_api(messages: list):
    """为提供的对话消息创建新的回答

    Args:
        messages (list): 完整的对话消息
    """
    completion = client.chat.completions.create(model="gpt-3.5-turbo", messages=messages)
    print(completion.choices[0].message.content)

def gpt_35_api_stream(messages: list):
    """为提供的对话消息创建新的回答 (流式传输)

    Args:
        messages (list): 完整的对话消息
    """
    stream = client.chat.completions.create(
        model='gpt-3.5-turbo',
        messages=messages,
        stream=True,
    )
    for chunk in stream:
        if chunk.choices[0].delta.content is not None:
            print(chunk.choices[0].delta.content, end="")

if __name__ == '__main__':
    messages = [{'role': 'user','content': '鲁迅和周树人的关系'},]
    # 非流式调用
    # gpt_35_api(messages)
    # 流式调用
    gpt_35_api_stream(messages)

这里有个小彩蛋:不愧是老外,会将鲁迅和周树人认为是两个人。

(2)免费的语音转文字服务

通常我们会需要语音转文字这个功能,那么这个功能,主要是两种方案:

  • 方案一:使用云服务,将服务发送给云服务器(缺点是:可能需要科学上网、速度相对慢一些)
  • 方案二:本地部署(有能力的自己写模型自己进行推理,也可以直接部署一些现成的模型)

方案一:使用云服务

我这里也是提供一个方案,其实有很多免费的服务,大家可以在评论区讨论
比如说使用SpeechRecognition库,(这个方法需要科学上网哈)

pip install SpeechRecognition

python 示例代码:

import speech_recognition as sr

# 创建一个Recognize实例
recognizer = sr.Recognizer()

# 读取语音文件
audio_file = sr.AudioFile("audio.wav")
with audio_file as source:
    audio_data = recognizer.record(source)

# 使用Google语音识别引擎识别语音
text = recognizer.recognize_google(audio_data, language="en-US")
print("识别结果:", text)

方案二:本地部署

如果本地部署的话就相对方案一来说速度会更快。
可以参考:有什么开源的python汉语语音转文字项目?_语音转文字开源-CSDN博客

我这里也给一个例子:
使用vosk库VOSK Models (alphacephei.com)

pip install vosk
from vosk import Model, KaldiRecognizer
import sys
import os
import wave

if not os.path.exists("model"):
    print("Please download the model from the Vosk website and unpack as 'model' in the current folder.")
    exit(1)

wf = wave.open(sys.argv[1], "rb")
if wf.getnchannels() != 1 or wf.getsampwidth() != 2 or wf.getcomptype() != "NONE":
    print("Audio file must be WAV format mono PCM.")
    exit(1)

model = Model("model")
rec = KaldiRecognizer(model, wf.getframerate())

while True:
    data = wf.readframes(4000)
    if len(data) == 0:
        break
    if rec.AcceptWaveform(data):
        print(rec.Result())
    else:
        print(rec.PartialResult())

print(rec.FinalResult())

当然你可能会遇到文件格式的问题,所以你可能还需要一个进行wav格式转换的库,例如:wave、pydub、scipy.io.wavefile等


(3)免费的文字转语音库

如果你想要你的GPT能够通过语音回答你,那么你可能又需要一个文字转语音的库。我发现目前很多博客提供的API都无法使用,但是现有的库的语音还是很机器人,我暂时没看到有比较好的免费、易用的API。
但是也有一些示例,勉强能用:

pip install edge_tts
import edge_tts
import asyncio

TEXT = "这里是您想要转换为语音的文本。"
voice = 'zh-CN-XiaoxiaoNeural'  # 选择一个语音模型
output = 'output.mp3'  # 输出文件的名称
rate = '-4%'  # 语速调整
volume = '+0%'  # 音量调整

async def text_to_speech():
    tts = edge_tts.Communicate(text=TEXT, voice=voice, rate=rate, volume=volume)
    await tts.save(output)

if __name__ == '__main__':
    asyncio.run(text_to_speech())
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,716评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,558评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,431评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,127评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,511评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,692评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,915评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,664评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,412评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,616评论 2 245
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,105评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,424评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,098评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,096评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,869评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,748评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,641评论 2 271

推荐阅读更多精彩内容