__
|\/| _. ._ (_ ._ _ _ _ |_
| | (_| | | \/ __) |_) (/_ (/_ (_ | |
/ |
ManySpeech-Cli 下载免免设计локальная командная строка行语语电影工作,手机локальное распознавание аудиофайлов、麦克鎦распознавание в реальном времени等能力。 предоставитьрежим взаимодействия与режим командной строкиДва способа использования: автоматическая загрузка модели.
✨ Функция обновления журнала
- 【12 мая 2026】 Новое управление файлами конфигурации, поддержка долговременных параметров, настройка, просмотр и т. д.
- 【11.05.2026】 重性 командная строка 行解析, поддержка аналитики параметров花全, автоматическое создание справки
- 【08.05.2026】 Добавьте больше поддержки моделей, упростите процесс взаимодействия, оптимизируйте формат вывода терминала.
- 【22 сентября 2025 г.】 поддерживать
fsmn-vad / silero-vad 双Модель VAD можно свободно переключать
- 【09.09.2025】 новый
2pass режим распознавания, оптимизация точности отметок времени
- 【05.09.2025】 поддержка вывода SRT — формат JSON, чистый текст. и т. д.
- 【29.08.2025】 首发
manyspeech-cli,поддержка локальной модели ASR.
🚀 краткая инструкция по эксплуатации
два режима использования
| режим |
режим запуска |
применимый сценарий |
| режим взаимодействия |
прямой двойной удар exe или беги manyspeech |
Ручное тестирование, изучение функций |
| режим командной строки |
manyspeech [参数] |
Скрипты, автоматизация, конвейеры |
подсказки по оптимизации производительности
- 将
--threads 2 Изменить на --threads 8 Можно настроить вручную
- 任什
--threads 0 вот и всеАвтоматическое определение ядра процессора,最么是是最了发发
💻 Быстрые и простые примеры
Пример 1: Первое использование (режим взаимодействия)
# 1. 双击运行程序
manyspeech-cli.exe
# 2. 选择语言(输入 1 或 2)
请选择语言: 1. 中文; 2. English;
1
# 3. 输入识别命令
> -t offline -f D:\test.wav
# 程序自动下载模型并开始识别,输出识别结果
# 首次运行会自动生成配置文件 manyspeech.json
Пример 2: идентификация одного ключа командной строки
# 打开 cmd 或 PowerShell,进入程序目录
cd D:\Tools\ManySpeech
# 识别单个文件
manyspeech -t offline -f test.wav
# 识别多个文件
manyspeech -t offline -f audio1.wav audio2.wav audio3.wav
Пример 3: Распознавание микрофона в реальном времени (выход ESC)
# 流式模型 + 麦克风(延迟最低)
manyspeech -t online -i mic
# 离线模型 + 麦克风(精度更高)
manyspeech -t offline -m chunk -i mic
# 2pass 模式 + 麦克风(兼顾实时与精度)
manyspeech -t 2pass -i mic
📁 управление файлами конфигурации
расположение файла конфигурации
При первом запуске программы вы увидите ее.каталог программыавтоматически генерируется manyspeech.json файл конфигурации:
| тип |
Путь Windows |
приоритет |
описание |
| Локальная конфигурация |
каталог программы manyspeech.json |
самый высокий |
便是版图像,随电影时间 |
| конфигурация пользователя |
%USERPROFILE%\.manyspeech\manyspeech.json |
中 |
персональные настройки пользователя |
| конфигурация системы |
%PROGRAMDATA%\ManySpeech\manyspeech.json |
низкий |
конфигурация по умолчанию на уровне системы |
Пример файла конфигурации
{
"version": "1.0.0",
"defaults": {
"method": "chunk",
"input": "file",
"format": "text",
"threads": 2,
"accuracy": "int8",
"model": "",
"model2": "",
"vad": "alifsmnvad-onnx",
"punc": "alicttransformerpunc-zh-en-mge-int8-onnx",
"base": "",
"output": ""
}
}
Описание поля конфигурации
| поле |
описание |
параметр 发电影全行行 |
значение по умолчанию |
method |
метод обработки |
-m, --method |
chunk |
input |
источник входного сигнала |
-i, --input |
file |
format |
выходной формат |
--format |
text |
threads |
电影数(0=автоматическое обнаружение) |
--threads |
2 |
accuracy |
точность модели |
--accuracy |
int8 |
model |
основное название модели |
-md, --model |
""(автоматическое сопоставление) |
model2 |
2-проходная модель |
--model2 |
""(автоматическое сопоставление) |
vad |
Название модели ВАД |
--vad |
alifsmnvad-onnx |
punc |
название модели |
--punc |
alicttransformerpunc-zh-en-mge-int8-onnx |
base |
корневой каталог модели |
-b, --base |
""(каталог программ) |
output |
рабочий каталог |
-o, --output |
""(текущий каталог) |
конфигурация управления командами
| команда |
описание |
пример |
--show-config |
Показать текущую информацию о конфигурации |
manyspeech --show-config |
--save-default |
Сохранить текущие параметры как конфигурацию по умолчанию. |
manyspeech -t offline -m chunk --save-default |
--reset-config |
Установить по умолчанию |
manyspeech --reset-config |
发动电影电影 (от высокого к низкому)
命令行参数(临时覆盖,最高优先级)
↓
--save-default 保存的参数
↓
本地配置文件(程序目录/manyspeech.json)
↓
用户配置文件(%USERPROFILE%\.manyspeech\manyspeech.json)
↓
系统配置文件(%PROGRAMDATA%\ManySpeech\manyspeech.json)
↓
环境变量(MANYSPEECH_*)
↓
程序内置默认值(最低优先级)
Пример использования конфигурации
# 查看当前配置
manyspeech --show-config
# 输出示例:
========== 当前配置 ==========
配置文件: D:\Tools\manyspeech.json
总运行次数: 15
上次运行: 2026-01-15 10:35:00
默认配置:
method: chunk
input: file
format: srt
threads: 4
accuracy: int8
base: D:\MyModels
output: D:\Output
...
# 保存当前参数为默认配置
manyspeech -t offline -m chunk --format srt --threads 4 --save-default
✅ 当前参数已保存为默认配置
# 之后直接运行,自动使用保存的默认值
manyspeech -f test.wav
# 重置配置
manyspeech --reset-config
✅ 配置已重置为默认值
-b, --base конфигурация каталога моделей
Каталог моделей можно указать следующим образом:
| приоритет |
метод конфигурации |
пример |
| 1 |
командная строка -b параметры |
manyspeech -t offline -b D:\MyModels -f test.wav |
| 2 |
в файле конфигурации base поле |
редактировать manyspeech.json 中国 "base": "D:\\MyModels" |
| 3 |
переменная среда MANYSPEECH_BASE |
set MANYSPEECH_BASE=D:\MyModels |
| 4 |
программы каталогов по умолчанию |
каталог программ |
# 方式1:命令行指定(临时)
manyspeech -t offline -b D:\TempModels -f test.wav
# 方式2:配置文件指定(永久)
# 编辑 manyspeech.json
{
"defaults": {
"base": "D:\\MyModels"
}
}
manyspeech -t offline -f test.wav # 自动使用 D:\MyModels
# 方式3:环境变量指定
set MANYSPEECH_BASE=D:\MyModels
manyspeech -t offline -f test.wav
-o, --output конфигурация каталога заданий
Рабочий каталог (результаты идентификации магазина, журналы, временные документы и т.п.) можно указать следующим образом:
| приоритет |
метод конфигурации |
пример |
| 1 |
командная строка -o параметры |
manyspeech -t offline -o D:\MyOutput -f test.wav |
| 2 |
в файле конфигурации output поле |
редактировать manyspeech.json 中国 "output": "D:\\MyOutput" |
| 3 |
переменная среда MANYSPEECH_OUTPUT |
set MANYSPEECH_OUTPUT=D:\MyOutput |
| 4 |
программы каталогов по умолчанию |
Текущий каталог |
# 方式1:命令行指定(临时)
manyspeech -t offline -o D:\TempOutput -f test.wav
# 方式2:配置文件指定(永久)
# 编辑 manyspeech.json
{
"defaults": {
"output": "D:\\MyOutput"
}
}
manyspeech -t offline -f test.wav # 自动输出到 D:\MyOutput
# 方式3:环境变量指定
set MANYSPEECH_OUTPUT=D:\MyOutput
manyspeech -t offline -f test.wav
💡 Типичный пример использования
1. 长长长离线流式动线 · 电影字幕
# FireRedASR 大模型(中文最佳,高精度)
manyspeech -t offline -m chunk --format srt --threads 4 -f "D:\audio\0.wav" --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212
# FunASR 轻量模型(速度快,资源占用低)
manyspeech -t offline -m chunk --format srt --threads 2 -f "D:\audio\0.wav" --model Fun-ASR-Nano-2512-LLM-int8-onnx
# Paraformer 大模型(通用场景,平衡精度与速度)
manyspeech -t offline -m chunk --format srt --threads 4 -f "D:\audio\0.wav" --model paraformer-large-wenetspeech-chuan-int8-onnx-offline
# Whisper large(多语言支持)
manyspeech -t offline -m chunk --format srt --threads 8 -f "D:\audio\0.wav" --model whisper-large-v3-turbo-int8-onnx-kv
# K2Transducer 轻量模型(实时性强,适合长音频)
manyspeech -t offline -m chunk --format srt --threads 2 -f "D:\audio\0.wav" --model k2transducer-zipformer-ctc-small-zh-int8-onnx-offline-20250716
2. Микрофоны для микрофона · 电影字幕
# FireRedASR 大模型(高精度,适合会议记录)
manyspeech -t offline -m chunk --format srt --threads 4 -i mic --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212
# FunASR 大模型(高精度,适合会议记录)
manyspeech -t offline -m chunk --format srt --threads 2 -i mic --model Fun-ASR-Nano-2512-LLM-int8-onnx
# Paraformer 轻量模型(低延迟,适合实时转录)
manyspeech -t offline -m chunk --format srt --threads 4 -i mic --model paraformer-large-zh-en-timestamp-int8-onnx-offline
# SenseVoiceSmall 小模型(低延迟,适合实时转录)
manyspeech -t offline -m chunk --format srt --threads 2 -i mic --model sensevoice-small-int8-onnx
3. Распознавание микрофона в реальном времени · Генерация в реальном времени 字幕
# Paraformer 流式模型(通用流式识别,稳定性好)
manyspeech -t online --format srt -i mic --model paraformer-large-zh-en-int8-onnx-online
# K2Transducer 大模型(中文流式,精度高)
manyspeech -t online --format srt -i mic --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630
# K2Transducer 超大模型(中文流式,极致精度,推荐高性能设备)
manyspeech -t online --format srt -i mic --model k2transducer-zipformer-ctc-xlarge-zh-onnx-online-yuekai-20250630
# K2Transducer 英文模型(英文通用)
manyspeech -t online --format srt -i mic --model k2transducer-zipformer-en-int8-onnx-online-zengwei-20230517
# Wenet 流式模型(中文通用)
manyspeech -t online --format srt -i mic --model wenet-u2pp-conformer-wenetspeech-int8-onnx-online-20220506
# Wenet 英文模型(英文通用)
manyspeech -t online --format srt -i mic --model wenet-u2pp-conformer-gigaspeech-onnx-online-20210728
# Whisper tiny 轻量模型(多语言)
manyspeech -t offline --format srt -i mic --model whisper-tiny-int8-onnx-kv
4. 2 прохода 双流联名名种 · 时间精修
# Paraformer 2pass(实时输出 + 最终精修)
manyspeech -t 2pass -i mic --model paraformer-large-zh-en-int8-onnx-online --model2 paraformer-seaco-large-zh-timestamp-int8-onnx-offline
# K2Transducer 2pass(流式实时 + 离线精修)
manyspeech -t 2pass -i mic --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630 --model2 k2transducer-zipformer-ctc-small-zh-int8-onnx-offline-20250716
# Wenet 2pass(流式实时 + 离线精修)
manyspeech -t 2pass -i mic --model wenet-u2pp-conformer-wenetspeech-onnx-online-20220506 --model2 wenet-u2pp-conformer-wenetspeech-int8-onnx-offline-20220506
📚 Список поддерживаемых моделей
Больше моделей, пожалуйста, обратитесь к:
https://modelscope.cn/profile/manyeyes?tab=model
⚙️ подробное описание параметров
Базовые опции
| параметры |
описание |
значение по умолчанию |
переменная среда |
-t, --type |
определить тип |
— |
MANYSPEECH_TYPE |
-m, --method |
метод обработки |
chunk |
MANYSPEECH_METHOD |
-i, --input |
Источник входного сигнала: аудиофайл/микрофон. |
file |
MANYSPEECH_INPUT |
-b, --base <路径> |
корневой каталог модели |
каталог программы |
MANYSPEECH_BASE |
-o, --output <目录> |
Рабочий каталог |
Текущий каталог |
MANYSPEECH_OUTPUT |
-md, --model <名称> |
основное название модели |
Автоматическое сопоставление |
MANYSPEECH_MODEL |
--model2 <名称> |
2 прохода |
Автоматическое сопоставление |
MANYSPEECH_MODEL2 |
--vad <名称> |
Модель обнаружения речи VAD |
alifsmnvad-onnx |
MANYSPEECH_VAD |
--punc <名称> |
восстановить тег модели |
alicttransformerpunc-zh-en-mge-int8-onnx |
MANYSPEECH_PUNC |
--accuracy |
точность модели |
int8 |
MANYSPEECH_ACCURACY |
--threads <数量> |
推理电视数,0= автоматическое обнаружение |
2 |
MANYSPEECH_THREADS |
--format |
выходной формат |
text |
MANYSPEECH_FORMAT |
-f, --files <文件...> |
Чтобы распознать аудиофайл (поддержка нескольких файлов) |
— |
— |
настроить параметры управления
| параметры |
описание |
--show-config |
Показать текущую информацию о конфигурации |
--save-default |
Сохранить текущие параметры как конфигурацию по умолчанию. |
--reset-config |
Установить по умолчанию |
список переменных среды
| переменная среда |
соответствующие параметры |
MANYSPEECH_TYPE |
-t, --type |
MANYSPEECH_METHOD |
-m, --method |
MANYSPEECH_INPUT |
-i, --input |
MANYSPEECH_BASE |
-b, --base |
MANYSPEECH_OUTPUT |
-o, --output |
MANYSPEECH_MODEL |
-md, --model |
MANYSPEECH_MODEL2 |
--model2 |
MANYSPEECH_VAD |
--vad |
MANYSPEECH_PUNC |
--punc |
MANYSPEECH_ACCURACY |
--accuracy |
MANYSPEECH_THREADS |
--threads |
MANYSPEECH_FORMAT |
--format |
Параметр скорости
-t = --type
-m = --method
-i = --input
-b = --base
-o = --output
-md = --model
-f = --files
📖 Подробное руководство по использованию
1. Описание правил по умолчанию
- не указан
-model При автоматическом использовании модели по умолчанию
- по умолчаниюАвтоматическое включение VAD断句 + 梦点时间
- указанный
--format srt Может генерировать стандартный документ 字幕.
- При отсутствии модели программа автоматически загрузится в фоновом режиме.
- файл конфигурации: Автоматическое создание впервые, можно редактировать для изменения параметров по умолчанию.
2. Быстрый опыт самой удобной команды
# 非流式识别(使用默认模型、默认测试音频)
manyspeech -t offline
# 实时流式识别(麦克风)
manyspeech -t online -i mic
# 2pass 双流融合识别
manyspeech -t 2pass -i mic
3. Локальное распознавание аудиофайлов.
# 单文件识别
manyspeech -t offline -f meeting.wav
# 多文件批量识别
manyspeech -t offline -f meeting1.wav meeting2.wav meeting3.wav
# 分片处理长音频(建议配合VAD,精度更高)
manyspeech -t offline -m chunk -f long_audio.wav
# 流式模型识别本地文件
manyspeech -t online -m chunk -f audio.wav
# 输出JSON格式(含时间戳)
manyspeech -t offline --format json -f audio.wav
# 指定输出目录
manyspeech -t offline -f audio.wav -o D:\Output
4. микрофон распознавания в реальном времени
# 流式模型 + 麦克风(延迟最低,约200ms)
manyspeech -t online -i mic
# 离线模型 + 麦克风(精度更高,约1-2秒延迟)
manyspeech -t offline -m chunk -i mic
# 2pass 模式 + 麦克风(首次实时输出,最终精修)
manyspeech -t 2pass -i mic
# 指定VAD模型
manyspeech -t online --vad silero-vad-v6-onnx -i mic
# 实时输出SRT字幕
manyspeech -t online --format srt -i mic
5. VAD/стандартная модель 启停与电影
# 禁用 VAD 和标点(原始识别结果)
manyspeech -t offline --vad "" --punc ""
# 切换 Silero VAD(更适合嘈杂环境)
manyspeech -t offline --vad silero-vad-v6-onnx -f audio.wav
# 使用默认 FSMN VAD(速度快,适合清晰语音)
manyspeech -t offline --vad alifsmnvad-onnx -f audio.wav
# 仅禁用标点,保留VAD
manyspeech -t online --punc "" -i mic
6. Формат вывода
# 输出 SRT 字幕(最常用)
manyspeech -t offline -m chunk --format srt -f audio.wav
# 生成 audio.srt 文件
# 输出 WebVTT 字幕(网页使用)
manyspeech -t offline --format vtt -f audio.wav
# 生成 audio.vtt 文件
# 输出 JSON 格式(程序解析)
manyspeech -t offline --format json -f audio.wav
# 输出结构化 JSON,含文本、时间戳、置信度
# 输出纯文本(默认)
manyspeech -t offline -f audio.wav
# 直接输出识别文字
7. Вручную укажите любую модель
# 查看可用模型:https://modelscope.cn/profile/manyeyes?tab=model
# SenseVoice 小模型(轻量快速)
manyspeech -t offline -i mic --model sensevoice-small-int8-onnx
# Whisper tiny(英文优化)
manyspeech -t offline -f english.wav --model whisper-tiny-en-onnx
# Whisper large(多语言高精度)
manyspeech -t offline -f multilingual.wav --model whisper-large-v3-turbo-zh-onnx-belle-20241016
# FireRedASR 大模型(中文最佳)
manyspeech -t offline -m chunk --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -f chinese.wav
# Paraformer 大模型(通用场景)
manyspeech -t offline -m chunk --model paraformer-large-zh-en-int8-onnx-offline -f general.wav
# K2Transducer 模型(实时性强)
manyspeech -t online -i mic --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630
# 2pass 模式指定副模型
manyspeech -t 2pass -i mic --model paraformer-large-zh-en-int8-onnx-online --model2 paraformer-seaco-large-zh-timestamp-int8-onnx-offline
8. Конфигурация переменных среды (подходит для высокочастотных сцен)
# Windows cmd
set MANYSPEECH_TYPE=online
set MANYSPEECH_METHOD=chunk
set MANYSPEECH_THREADS=4
set MANYSPEECH_FORMAT=srt
set MANYSPEECH_OUTPUT=D:\Output
manyspeech -i mic
# Windows PowerShell
$env:MANYSPEECH_TYPE="online"
$env:MANYSPEECH_METHOD="chunk"
$env:MANYSPEECH_THREADS="4"
$env:MANYSPEECH_FORMAT="srt"
$env:MANYSPEECH_OUTPUT="D:\Output"
manyspeech -i mic
9. Пример интерактивного режима завершен.
# 启动交互模式
manyspeech
# 会话示例:
=====================================
请输入参数 (输入 'exit' 退出,直接回车显示帮助):
# 识别单个文件
> -t offline -f D:\test.wav
[识别结果...]
# 批量识别
> -t offline -f 1.wav 2.wav 3.wav --format srt
[生成3个字幕文件...]
# 麦克风实时识别
> -t online -i mic
[按 ESC 退出...]
# 指定模型识别
> -t offline -i mic --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212
# 指定输出目录
> -t offline -f test.wav -o D:\MyOutput
# 查看配置
> --show-config
# 保存当前参数为默认
> -t offline -m chunk --format srt --save-default
# 查看帮助
> --help
# 退出
> exit
10. Пример сценария пакетной обработки
# Windows批处理脚本 (batch_process.bat)
@echo off
setlocal enabledelayedexpansion
set INPUT_DIR=D:\audio
set OUTPUT_DIR=D:\output
for %%f in ("%INPUT_DIR%\*.wav") do (
echo Processing %%f...
manyspeech -t offline -m chunk --format srt --threads 4 -f "%%f" -o "%OUTPUT_DIR%"
)
echo All files processed!
pause
# PowerShell 脚本 (batch_process.ps1)
$inputDir = "D:\audio"
$outputDir = "D:\output"
Get-ChildItem $inputDir -Filter *.wav | ForEach-Object {
Write-Host "Processing $($_.Name)..."
& manyspeech -t offline -m chunk --format srt --threads 4 -f $_.FullName -o $outputDir
}
Write-Host "All files processed!"
📌дополнительное объяснение
Определите тип подробно
| тип |
описание |
применимый сценарий |
offline |
非流式动行,推车设计аудиопосле вывода |
Распознавание документов, длинный звук, удаленная сцена |
online |
Распознавание в реальном времени, 边较边出字 |
микрофон, прямая трансляция, сцена с низкой задержкой |
2pass |
双流结果名种, вывод в реальном времени + окончательный результат |
Существуют сценарии, требующие точности и режима реального времени. |
Подробный формат вывода
| формат |
описание |
использует |
text |
Чистый текст, 每句一行 |
Быстрый просмотр, запись журнала |
json |
Формат JSON. |
电影解析、вторичная обработка |
srt |
Формат SubRip |
Программное обеспечение для редактирования видео |
vtt |
Формат WebVTT |
Веб-браузер, браузер |
Подробный метод обработки
| манера |
описание |
применимый сценарий |
one |
Однократная обработка всего аудио |
Короткое аудио, быстрый тест |
batch |
Пакетная обработка нескольких полных аудиофайлов |
Пакетная обработка нескольких файлов |
chunk |
分礼流式电影 |
Длинный звук, потоковая передача в реальном времени |
Внимание
- файл конфигурации: Первый запуск генерируется автоматически.
manyspeech.json,можно редактировать для изменения параметров по умолчанию
- загрузка модели: При отсутствии модели программа автоматически загружается в фоновом режиме, ручная установка не требуется (более крупные модели, сначала загрузите
- LFS мерзавец: Установка Git LFS, автоматическая обработка (программа и автоматическая обработка)
2pass Основная модель-онлайн-модель, вторая модель model2 для проводной модели
- распознавание микрофонапроцесс клавиша ESC ты можешь выйти
- команда:
--help 或 -h Вы можете просмотреть полное описание параметра
- название модели: Название модели можно получить на страницах ModelScope.
🔗 ссылка на проект
Многие страницы речи