Ai音频转文字-语音转文字Whisner保姆级

大坤分享 2023-04-08 原文

Whisner是一个开源的Ai音频转文字、语音转文字工具，其实现在很多短视频制作，都在使用这两种技术，省时省力又省钱。

这就是为什么在短视频平台上充斥着大量相同声音的电影解说类的视频，它们无一例外都使用了Ai技术。

如果你的电脑有显卡，那么强烈你推荐使用它，不仅速度快而且它的准确率特别高。

下载教程

Whisper ：开源项目 【点击下载】
ggml-medium 语音模型： 【点击下载】
CPU版的Whisper：【开源项目】

以显卡版本为例，我们只需要下载第一个主程序就可以了。如果你没有显卡，那么就下载第三个CPU版本的。

我在文章底部也有提供我自己打包好的（主程序+模型）微云下载链接

1.点击下载后我们将打开如下页面，我们选择WhisperDesktop.zip下载。

2.然后把ggml-medium 语音模型 也下载好

如下图所示，模型不同，占用的显卡内容也不同，如果你的显卡内存大于4G，请你直接选择下载大模型。

模型越大处理的信息越准确，相对的也会占用你大量的显卡内存。

我是大于4G的，所以我在这里就直接下载最大的

一、音频转文字教程

然后把它们解压到桌面或者你喜欢的路径。

运行WhisperDesktop.exe，就会出现如下页面。

按照图片示例，点击“…”选择我们下载好的ggml-medium 语音模型

然后我们点击图片示例“advanced”选择我们的显卡。

对应自己的显卡型号，选择完毕后，点击确定。

接下来，软件会回到主界面，我们继续点击OK。

接下来就会进入到下一个页面中。如下图实例。

选择导出的语言类型，支持很多种。
导入MP3/mp4等一切可播放的格式
选择导出的文档类型（Text file就是txt格式的，也支持字幕格式SubRip subtitles，选择好自己需要的格式即可。）
选择要导出的路径
开始

Translate：是翻译功能，如果原文说的是中文，你就不要勾选了。说的是其他语言你就需要勾选。

Debug Console：它是一个运行处理窗口，开不开都无所谓，看个人的喜好了。

点击Transcribe，弹出提示框，继续点击确定。等待处理完毕即可。

下图是勾选Debug Console的运行窗口。

好了这样我们就把语音转文字的流程全部完成了，它的准确率非常高，而且支持离线使用，方便不受制于人。

二、语音转文字

在主页点击Audio Capture 按钮

选择麦克风后，点击录制，就可以了。如下图所示

Whisper打包下载：

微云下载：https://share.weiyun.com/xqnSZGM1

本文链接：https://www.1552.cn/2011.html

Ai音频转文字-语音转文字Whisner保姆级的更多相关文章

通过Azure bot framework composer 设计一个AI对话机器人bot（查询天气）

通过Azure bot framework composer 设计一个AI对话机器人bot（查询天气）本文介 […]...

王晶：华为云OCR文字识别服务技术实践、底层框架及应用场景 | AI ProCon 2019

演讲嘉宾 | 王晶（华为云人工智能高级算法工程师王晶）出品 | AI科技大本营（ID:rgznai100） […]...

Python3 与 NetCore 基础语法对比（就当Python和C#基础的普及吧）

VSCode设置python3的开发环境（linux下默认是python2）https://www.cnblo […]...

写给.NET开发者的Python教程(一):引言

距离上一篇博文已过去8个月了，这段时间发生了很多事情导致没能持续更新博客。这段时间除了工作繁忙，业余时间都投入 […]...

机器学习中的几个概念的关系

目前, 机器学习主要由以下三条主线进行发展: graph LR subgraph 三代神经网络 A[1 线性分 […]...

ChatMind-人工智能AI生成思维导图

ChatMind，是一款利用与 AI 的对话中生成和编辑思维导图的工具，支持上下文改写扩充对话，ChatMind AI 可用于多种场景，例如记笔记、日程安排、项目管理、头脑风暴、框架等等。既能帮助用户快速总结分析，又能源源不断地提供创作灵感，致力为用户提供最优质的智能化思维导图方案，专注于AI生成思维导图的效率工具。...

用遗传算法进行智能排课，相信老师会很喜欢

摘要：遗传算法（Genetic Algorithm）是一种基于自然选择过程，模拟生物进化的AI模型，它可以在模 […]...

Azure AI 服务之语音识别

笔者在前文《Azure AI 服务之文本翻译》中简单介绍了 Azure 认知服务中的文本翻译 API，通过这些 […]...

随机推荐

补码

先确定用00000000-011111111表示0-127,然后再用它们按位取反加1后的数据表示负数. 如: […]...

我的Cocos2d-x学习笔记（九）游戏帧循环（游戏主循环）

游戏运行时候会不断按照游戏逻辑规则重新绘图，反复处理用户输入、处理定时事件、绘图，直到游戏结束。 […]...

只需十四步：从零开始掌握 Python 机器学习（附资源）

只需十四步：从零开始掌握 Python 机器学习（附资源）分享一篇来自机器之心的文章。关于机器学习的起步，讲 […]...

Angular2入门–架构概览