Skip to content

Latest commit

 

History

History
375 lines (317 loc) · 17.7 KB

README.zh_cn.md

File metadata and controls

375 lines (317 loc) · 17.7 KB

README.md

🎶 WhisperMate - 使用 Whisper AI 模型将声音转换为敏感本地化的文本!

从 Mac App Store 下载最新版本.

应用图标

功能

WhisperMate 使用 Whisper AI 模型将音频和视频文件转换为文本。您可以使用应用中的任何部分通过集成的文本编辑器查看转换结果。 所有转换过程都在您的设备上进行,确保了您数据的隐私保护。

V5.5.1

  • 修复了在自动化翻译时项目完成时崩溃的问题
  • 148 MB

V5.5.0

  • 添加Deepgram nova-2模型选项。
  • 添加实时语音处理的透明度设置。
  • 添加实时翻译结果显示设置。
  • 添加自定义实时窗口背景和文本颜色设置。
  • 修复使用Deepgram模型时自动配置未被应用的错误。
  • 修复实时滚动窗口不能保持打开的错误。
  • 148 MB

V5.4.9

  • 添加批量导出项目模板功能,可以从模板脚本中将选定的项目结果导出到一个文件中
  • 修复错误和提升性能
  • 148 MB image

V5.4.8

  • 在主窗口底部状态栏中添加隐私设置,可以禁用事件分析、崩溃报告和本地日志
  • 添加删除符合条件行的脚本示例
  • 添加替换字幕字符串的脚本示例,例如将“(音乐)音乐[音乐]”替换为空字符串
  • 添加写回属性.memo .markWarn .warnMsg的脚本示例
  • 添加预览字幕延迟显示选项
  • 在字幕编辑工具包中添加批量修改字幕开始或结束时间的功能
  • 在字幕编辑器中添加(⇧)+←→快捷键,以快速跳转到预览器5秒或30秒的位置
  • 添加演讲者控制栏,并支持使用快捷键快速设置
  • 修复预览器字幕无法隐藏的问题
  • 修复模板编辑器无法将文本剪切到剪贴板和无法通过拖动选择的问题
  • 修复导出自定义模板.t0f5 .t0f4 .t0f2时间范围格式仍然返回3位数字的毫秒问题
  • 148 MB

V5.4.7

  • 在项目列表中添加文件时,添加自动启动项目选项(在主窗口底部状态栏上切换)。
  • 添加自动导出文件到自定义文件夹的自动化步骤。
  • 添加将结果发送到您的邮箱的自动化步骤(可以自动使用之前的自动导出结果作为附件)。
  • 升级模板和JavaScript编辑器以修复崩溃问题。
  • 148 MB image

V5.4.6

  • 添加媒体预览字幕布局选项,原始文本和翻译字幕可以控制显示在上或下方。
  • 添加了大型v3 coreml模型。
  • 添加⌘+⌥+f快捷键或双击预览以快速切换到全屏。
  • 现在一些快捷键支持按下单个字符触发(合并,拆分,调整)。
  • 合并字幕后,现在会自动选择第一个合并的行。
  • 取消绑定默认打开声音和视频文件的whisper mate应用程序。
  • 修复了V5.4.5中的一些崩溃错误。
  • 修复了通知显示问题。
  • 修复了一些翻译问题。
  • 123 MB

image

V5.4.5

  • ❗通用版本可能需要重新下载。因为我升级了我的开发设备,并忘记保存通用部署EDKey。
  • 添加自动化功能,在项目转录完成后执行作业(合并重复/快照/脚本/翻译)。
  • 添加最大分段长度转录选项。
  • 添加模型提示示例。
  • 在替换功能中使用replace to with char '\n'(单斜杠加字符n)来换行。
  • 升级项目转录选项配置界面。
  • 122 MB

image

V5.4.4

  • 在模型配置面板中添加模型云列表,支持2个下载主机(如果无法在主机1中下载,请切换到主机2)。
  • 当在通用设置中禁用GPU加速选项时,启用CoreML模块作为备选支持。
  • 修复了下载大型模型失败的问题。
  • 修复了在非Apple Silicon设备上崩溃的问题。
  • 122 MB

V5.4.3

  • 提高转录速度
  • 添加对Whisper大型v3模型的支持
  • 添加对LibreTranslator引擎的支持
  • 在项目上下文菜单中添加复制项目功能
  • 在编辑模式(⌘+E)中可以直接输入更新说话者字段
  • 修复当选项卡数量大于2时出现的选项卡窗口问题
  • 修复波形视图有时崩溃的问题
  • 修复字幕编辑器中无法翻译选定行的问题

V5.4.2

  • 添加配置文件密语处理线程数选项。(使用较少的线程,让计算机处理其他任务,但处理时间会增加)
  • 添加Deepgram语音转录引擎支持,还支持实时流式转录模式。
  • 添加导出仅包含自定义发言者内容的模板示例。
  • 添加以@开头的关键字搜索功能,用于过滤发言者行或将所有发言者名称替换为另一个名称(例如:@tom-->jack)。
  • 添加保存最新项目发言者配置并在新项目中重复使用的功能。
  • 自定义模板导出现在支持9个自定义模板。

V5.4.1

  • 添加内网网页远程管理功能,您可以使用手机或其他设备添加文件进行处理并查看处理状态(在主窗口底部状态栏中)
  • 添加AI参数配置模板选择器。
  • 添加抑制标点符号的AI参数。
  • 使用同步的HTTP请求来进行数据的获取或者提交(可以使用它来将字幕的行数据提交到本地的llm服务以获取修正的推理结果,并将结果填回到原始的字幕中,或者提交到其他的HTTP/HTTPS系统服务,请查看javascript处理器中的HTTP示例来了解如何使用它)。
  • 修复包含空格字符的文件路径时噪音消除WAV文件错误。

image

V5.4

  • 添加快速剪切功能
  • 添加快捷键(C)以显示或隐藏字幕编辑器预览播放器
  • 添加快捷键以更改字幕编辑器预览播放器的速度
  • 将静默策略替换为分块策略
  • 修复去噪选项错误

新的快速剪切功能具有以下功能:

  • 可视化音频波形以精确定位和修剪视频。
  • 将较长的多媒体文件分割成多个段落,以便在转录之前单独处理。
  • 使用分块策略跳过静默或不可转录的片段。
  • 将需要转录的片段分别修剪为单独的文件。

image

V5.3.1

  • 在批处理队列中添加项目优先级属性,优先级高的将先处理(选项在右键菜单中)
  • 字幕文本替换功能还会替换翻译文本中的匹配关键字
  • 修复了重新转录时跳过静音策略和减少噪音的问题

V5.3

  • 为语言添加更多调整过的模型(小/中型)
  • 添加传输策略以跳过静音片段(根据分贝和静音持续时间进行分类)
  • 添加减少背景噪音的选项
  • 添加使传输压制字幕提前显示时间戳的选项(不剧透)
  • 添加示例JavaScript处理器以大写片段字幕

V5.2

  • 添加了对不同语言推理的优化模型。包括粤语/中文/韩语/日语/德语/法语/泰语/乌克兰语等。
  • 添加了将本地优化的Whisper AI模型加入Whisper Mate的功能。
  • 添加了批量设置项目模型参数的功能。
  • 添加了选项,防止运行队列时启动屏幕保护。
  • 修复了系统启动屏幕保护时任务暂停的问题。
  • 修复了有时无法通过点击字幕编辑器行来导航到播放器位置的问题。
  • 修复了无法通过右键菜单调用撤销和重做修改的文本的问题。
  • 修复了批量导出时合并时间范围不匹配的问题。

V5.1

  • 添加批量导出项目片段/srt模板的功能,并添加选项将它们合并为一个文件。
  • 添加重新转录所选行的功能,可更改AI参数。
  • 添加在字幕文本内容中撤销或重做文本更改的功能,可通过手动更改键盘快捷键(⌘+Z 撤销 / ⌘+⇧+Z 重做)实现。
  • 添加在选定行下方添加新的空白字幕行的功能(快捷键⌘+N)。
  • 添加通过Slack传入Webhook发送项目完成通知的功能。(可以在每个项目转录完成后通过手机收到通知)
  • 修复了播放媒体控制框在上下样式布局中未对齐居中的问题。

V5.0

  • 添加批量合并连续段落的快速自动合并字幕的工具
  • 添加自定义脚本处理器以批处理调整转写的字幕
  • 添加字幕编辑器调整功能,类似于分割和合并功能,可以选择多行然后在一个文本框中逐行调整它们
  • 添加更多的快捷键支持的字幕编辑器
  • 在视频预览的字幕样式配置面板中添加自定义字体的选项
  • 在将硬字幕烧录到原始视频的配置面板中添加自定义字体的选项
  • 添加导出为Pdf或Docx文件的支持,只需要将导出后缀设置为pdf或docx
  • 添加更多预定义的导出示例格式,您可以从例子中加载,然后简单地调整模板结果
  • 添加对当前项目字幕状态进行快照的功能。然后方便地恢复到保存的快照状态
  • 添加将.Srt导入到当前项目作为快照的选项
  • 添加选项将预览视频的字幕显示翻译文本覆盖源文本
  • 添加自定义导出函数。随机数字& 随机GUID & escXML & 用自定义格式替换字符串
  • 添加自定义导出输出类型(文件或剪贴板)
  • 添加自定义导出选项,使用所有字幕进行导出或仅选择的字幕
  • 添加项目编辑窗口组与主窗口选项
  • 在模型选择器(右下角)中添加额外的耳语模型处理参数配置,可能不容易找到。因为大多数情况下不需要修改这些参数
  • 优化全屏预览视频的行为
  • 搜索关键字支持条件(使用|作为或关键字。例如“hi|hello|hey”)
  • 优化搜索和替换逻辑。当执行替换时,搜索关键字将调整以显示源关键字和替换关键字
  • 优化实时流转录逻辑
  • 修复一些子窗口不带到前台的问题
  • 修复导出xml格式的一些错误
  • 修复一些媒体提取wav失败的问题
  • 修复离开替换关键字字段将自动触发替换操作的问题
  • 修复某些流项目崩溃的问题

V4.0

  • 增加功能以记住项目字幕编辑器的布局属性。每个项目可以使用不同的布局和预览播放器大小。(旧项目需要重新打开才能记住布局属性)
  • 添加在编辑器中查找重复字幕的选项。
  • 添加上下文菜单选项,即使转录脚本进程未启动也可以打开编辑器。
  • 添加将字幕导出为.sbv格式的选项。
  • 添加自定义导出模板功能(例如.fcpxml,.itt,.ttml)。
  • 添加新插件。
  • 添加常用关键词和替换配置选项,以便快速重用搜索或替换。
  • 添加标记的行在预览播放器的进度视图中显示标记标志。
  • 添加在字幕编辑器上下文菜单中添加标记选项。
  • 在选择单行时,在字幕编辑器中添加拆分行功能。
  • 添加搜索结果中显示项目名称的行。
  • 在预处理媒体遇到错误时显示错误信息。
  • 添加隐藏编辑器定位行按钮的选项。
  • 添加⌘+S快捷键,快速将.srt导出到文件。
  • 修复媒体通道音频元信息获取两个音频通道,但实际上只有一个。(添加选项忽略音频通道选择)
  • 修复更改项目名称后烧录字幕失败的问题。
  • 修复macOS12上的一些UI问题。
  • 修复保持在功能中未锁定显示状态栏图标的选项。
  • 修复一些浅色主题下的UI显示问题。

V3.5

  • 新增字幕音频下载功能。现在您可以选择任何字幕,然后使用上下文菜单下载其音频剪辑,当选择多行时,它们会自动合并为一个音频剪辑。
  • 添加了实时捕获音频的小型浮动窗口样式。
  • 添加菜单栏上的上下文菜单,可以快速开始将记录流到新的浮动窗口项目。
  • 在全局搜索结果中快速播放段落范围内的音频,或直接下载搜索结果的音频范围剪辑。
  • 模型下载现在支持断点续传。
  • 添加了字幕备忘录功能,您现在可以在编辑器中为任何字幕添加备忘录。
  • 添加Azure翻译选项。
  • 在所有项目中添加全局字幕搜索。
  • 在搜索结果中添加搜索关键词的突出显示。
  • 为快速控制窗口添加了默认快捷键,例如关闭/缩放/最小化。
  • 添加了隐藏主工具栏标签的选项。
  • 将批量启动按钮从主工具栏移到上下文菜单中。
  • 修复替换无法替换为空字符串的问题。
  • 修复备份服务器缺少小型和小型英文模型的问题。
  • 修复录制的音频文件播放器滑块位置字幕问题。

V3.0

  • 添加将选定的字幕媒体范围导出到一个新的媒体剪辑文件
  • 添加将视频与烧录硬字幕导出到原始视频和自定义字幕样式
  • 添加在视频预览中直接预览字幕(字幕样式可以在偏好设置面板中自定义)
  • 添加录制麦克风音频并支持实时转录(macOS13+)
  • 添加字幕合并功能。段落范围和字幕将合并为一行。
  • 添加应用程序音频录制将自动保存为文件,并可将其转换为新的转录项目。
  • 添加选项以复制字幕行,并允许修改内容或时间范围以微调完整字幕。
  • 添加选项在项目模型配置面板中启用Whisper嵌入式英语翻译。
  • 添加选项在项目模型配置面板中使用Whisper提示令牌配置。
  • 添加选项禁用预览视频时自动滚动字幕行。
  • 添加支持自定义媒体预览重放速度。
  • 添加支持使用⌘+V将复制的文件粘贴到处理队列中。
  • 添加快速切换到编辑模式的功能。所有字幕可以通过快捷键(⌘+E)进行编辑或查看切换。
  • 添加Whisper处理时显示CPU使用率百分比。
  • 添加通过上下文菜单归档项目的支持(保持工作项目列表清洁)。
  • 添加字幕翻译控制中的谷歌翻译。
  • 添加支持更多应用程序语言。
  • 添加全尺寸预览媒体与字幕布局。
  • 添加支持在Finder的“打开方式”功能中打开媒体文件。
  • 优化大量数据行渲染速度的字幕编辑器。
  • 修复多音频通道视频选择问题。
  • 修复预览和编辑字幕跳动和视频滑块导航问题。

版本2.0

  • 支持在其他应用程序(如Zoom/Skype/Teams/会议应用程序,仅限macOS13.0+)中捕捉和转录音频
  • 添加插件以批量转换简体中文字幕为繁体或反向转换(需先在首选项面板中激活插件)
  • 修复项目编辑器无法使用空格快捷键播放或停止媒体的问题
  • 修复SRT和VTT导出格式的错误

版本1.0

  • 转录音频或视频文件
  • 使用deepl免费api翻译字幕
  • 嵌入字幕编辑器,以修正转录错误
  • 导出为SRT、VTT、CSV、JSON、SEGMENT格式
  • 支持为每个字幕设置发言人
  • 大多数操作支持批量选择,例如批量运行任务、批量翻译行或批量设置发言人
  • 支持拖放文件开始转录
  • 支持在搜索转录时键入文本
  • 编辑器可预览音频或视频文件,并与播放范围同步
  • 支持多语言转换
  • 支持自定义常用语言,以供转换或翻译使用

特点

  • 将音频和视频文件转换为文本
  • 录制并转换来自Zoom / Skype / Teams /其他程序的对话(要求macOS 13.0或更高版本)
  • 使用DeepL API进行免费翻译
  • 在软件中集成了字幕编辑工具
  • 输出SRT,VTT,CSV,JSON和SEGMENT格式的文件
  • 可根据需求选择字幕命名
  • 同时支持多种功能,如批量转换或团队合作和分析
  • 支持拖放文件以转换字幕
  • 在输入过程中回顾字幕
  • 在编辑器中播放示例音频或视频
  • 将选定的字幕导出为新的媒体文件
  • 以预定义类型或用户定义类型将字幕添加到原始视频
  • 在预览窗口中即时查看字幕(可在字幕设置中自定义)
  • 在录制过程中直接将文本转换为语音(仅适用于macOS 13及更高版本)
  • 结合字幕部分-将时间段和文本结合成一行
  • 自动保存项目并将其转换为新项目的能力
  • 复制或更改字幕行的时间
  • 针对图片演示文稿进行播放配置
  • 使用快捷菜单通过按下Cmd + V组合键将文件插入队列
  • 在音频编辑过程中显示CPU使用情况
  • 支持创建缩略文件(用于清理使用列表)
  • 使用Google Translate支持文本翻译
  • 在媒体播放时显示全屏字幕
  • 通过快捷菜单打开媒体
  • 支持多种语言或常用语言的翻译

screenshot

screenshot1

screenshot2

screenshot3

screenshot4

screenshot5

screenshot6

screenshot7

screenshot8

screenshot10

screenshot11

screenshot12

screenshot13

screenshot14

screenshot15

screenshot16