<返回更多

用 C# 开发自己的语音识别程序

2021-06-10  今日头条  CTO修炼手册
加入收藏

开发工具:vs 2017

AI 平台:http://ai.baidu.com/

准备工作

1、注册百度账号

2、登录百度 AI 开发平台,http://ai.baidu.com/

3、在控制台点击“百度语音”服务,点击“创建应用”,填写必填项,勾选额外接口,点击立即创建获取秘钥。在应用列表中查看自己的id

「语音」用 C# 开发自己的语音识别程序

 

用 360 软件管家安装 vs2017

「语音」用 C# 开发自己的语音识别程序

 

创建自己的项目

1、新建项目

打开 vs2017,点击文件,新建项目,选择 visual C# --> windows 桌面 --> windows 窗体应用,选择自己的项目地址,点击确定

「语音」用 C# 开发自己的语音识别程序

 

2、添加 baiduai 开发包

点击引用 --> 管理 nuGet 程序包,搜索 baiduai,点击下载

「语音」用 C# 开发自己的语音识别程序

 

3、UI 设计

直接拖动即可,生成界面如下

「语音」用 C# 开发自己的语音识别程序

 

4、后台功能实现

选择文件按钮

private void button1_Click(object sender, EventArgs e)
{
    OpenFileDialog fdlg = new OpenFileDialog();
    fdlg.Title = "C# Corner Open File Dialog";
    //fdlg.InitialDirectory = @"c:/";   //@是取消转义字符的意思
    //fdlg.Filter = "All files(*.*)|*.*|All files(*.*)|*.* ";
    ///*
    // * FilterIndex 属性用于选择了何种文件类型,缺省设置为0,系统取Filter属性设置第一项
    // * ,相当于FilterIndex 属性设置为1.如果你编了3个文件类型,当FilterIndex =2时是指第2个.
    // */
    fdlg.FilterIndex = 2;
    ///*
    // *如果值为false,那么下一次选择文件的初始目录是上一次你选择的那个目录,
    // *不固定;如果值为true,每次打开这个对话框初始目录不随你的选择而改变,是固定的  
    // */
    //fdlg.RestoreDirectory = true;
    if (fdlg.ShowDialog() == DialogResult.OK)
    {
        //textBox1.Text = System.IO.Path.GetFileNameWithoutExtension(fdlg.FileName);
        filePath.Text = System.IO.Path.GetFullPath(fdlg.FileName);

    }
}

开始识别按钮

// 语音合成按钮
private void button2_Click(object sender, EventArgs e)
{
    string value = this.videoType.Text;
    String filePath = this.filePath.Text;
    // 设置AppID/AK/SK,修改为自己的
    String APP_ID = "14****92";
    String API_KEY = "C7WM**********Q6aQImtj3qua";
    var client = new Asr(APP_ID, API_KEY, SECRET_KEY);
    client.Timeout = 60000;  // 修改超时时间
    client.Timeout = 120000; // 若语音较长,建议设置更大的超时时间. ms
    FileStream fs = new FileStream(filePath, FileMode.Open, FileAccess.Read);
    byte[] buffur = new byte[fs.Length];
    try
    {
        fs.Read(buffur, 0, (int)fs.Length);

    }
    catch (Exception ex)
    {
        Console.Write(ex.StackTrace);
    }
    finally
    {
        if (fs != null)
        {
            //关闭资源  
            fs.Close();
        }
    }
    var result = client.Recognize(buffur, value, 16000);
    Convert.ToString(result);

    JToken resultStr = null;
    result.TryGetValue("result", out resultStr);
    Console.WriteLine("aToken===>"+ resultStr);
    voiceResult.Text = Convert.ToString(resultStr);
    Console.Write(result);
}

开始合成按钮

调用 api 中 C# SDK 的语音合成 api

https://ai.baidu.com/docs#/ASR-Online-Csharp-SDK/top

// 开始合成按钮(语音合成功能)
private void synthesisButton_Click(object sender, EventArgs e)
{
    String APP_ID = "14*****92";
    String API_KEY = "C7W**********5GD08";
    String SECRET_KEY = "xcvw************qua";
    // 获取输入框的值
    String value = this.Speech_Synthesis.Text;
    // 将 value 转成语音文件存放到本地
    var client = new Baidu.Aip.Speech.Tts(API_KEY, SECRET_KEY);
    // 可选参数
    var option = new Dictionary<string, object>()
    {
        {"spd", 5}, // 语速
        {"vol", 7}, // 音量
        {"per", 3}  // 发音人,4:情感度丫丫童声
    };
    var result = client.Synthesis(value, option);
    try {
        if (result.ErrorCode == 0) { // 或 result.Success
            File.WriteAllBytes("E:/prepared/WindowsFormsApplication1/WindowsFormsApplication1/tmp.mp3", result.Data);
        }

    } catch (Exception ex) { Console.Write(ex.StackTrace); }
    Play();
}

源码:https://github.com/zhongsb/voiceRecogniction.git

声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多资讯 >>>