Manyspeech-cli 语语电影安全行工作 – 从孑剧情 – 博客园

                  __                    
 |\/|  _. ._     (_  ._   _   _   _ |_  
 |  | (_| | | \/ __) |_) (/_ (/_ (_ | | 
              /      |

ManySpeech-Cli 下载免免设计локальная командная строка行语语电影工作，手机локальное распознавание аудиофайлов、麦克鎦распознавание в реальном времени等能力。 предоставитьрежим взаимодействия与режим командной строкиДва способа использования: автоматическая загрузка модели.

✨ Функция обновления журнала

【12 мая 2026】 Новое управление файлами конфигурации, поддержка долговременных параметров, настройка, просмотр и т. д.
【11.05.2026】 重性 командная строка 行解析, поддержка аналитики параметров花全, автоматическое создание справки
【08.05.2026】 Добавьте больше поддержки моделей, упростите процесс взаимодействия, оптимизируйте формат вывода терминала.
【22 сентября 2025 г.】 поддерживать fsmn-vad / silero-vad 双Модель VAD можно свободно переключать
【09.09.2025】 новый 2pass режим распознавания, оптимизация точности отметок времени
【05.09.2025】 поддержка вывода SRT — формат JSON, чистый текст. и т. д.
【29.08.2025】 首发 manyspeech-cli，поддержка локальной модели ASR.

🚀 краткая инструкция по эксплуатации

два режима использования

режим	режим запуска	применимый сценарий
режим взаимодействия	прямой двойной удар `exe` или беги `manyspeech`	Ручное тестирование, изучение функций
режим командной строки	`manyspeech [参数]`	Скрипты, автоматизация, конвейеры

подсказки по оптимизации производительности

将 --threads 2 Изменить на --threads 8 Можно настроить вручную
任什 --threads 0 вот и всеАвтоматическое определение ядра процессора，最么是是最了发发

💻 Быстрые и простые примеры

Пример 1: Первое использование (режим взаимодействия)

# 1. 双击运行程序
manyspeech-cli.exe

# 2. 选择语言（输入 1 或 2）
请选择语言: 1. 中文; 2. English;
1

# 3. 输入识别命令
> -t offline -f D:\test.wav

# 程序自动下载模型并开始识别，输出识别结果
# 首次运行会自动生成配置文件 manyspeech.json

Пример 2: идентификация одного ключа командной строки

# 打开 cmd 或 PowerShell，进入程序目录
cd D:\Tools\ManySpeech

# 识别单个文件
manyspeech -t offline -f test.wav

# 识别多个文件
manyspeech -t offline -f audio1.wav audio2.wav audio3.wav

Пример 3: Распознавание микрофона в реальном времени (выход ESC)

# 流式模型 + 麦克风（延迟最低）
manyspeech -t online -i mic

# 离线模型 + 麦克风（精度更高）
manyspeech -t offline -m chunk -i mic

# 2pass 模式 + 麦克风（兼顾实时与精度）
manyspeech -t 2pass -i mic

📁 управление файлами конфигурации

расположение файла конфигурации

При первом запуске программы вы увидите ее.каталог программыавтоматически генерируется manyspeech.json файл конфигурации:

тип	Путь Windows	приоритет	описание
Локальная конфигурация	каталог программы `manyspeech.json`	самый высокий	便是版图像,随电影时间
конфигурация пользователя	`%USERPROFILE%\.manyspeech\manyspeech.json`	中	персональные настройки пользователя
конфигурация системы	`%PROGRAMDATA%\ManySpeech\manyspeech.json`	низкий	конфигурация по умолчанию на уровне системы

Пример файла конфигурации

{
  "version": "1.0.0",
  "defaults": {
    "method": "chunk",
    "input": "file",
    "format": "text",
    "threads": 2,
    "accuracy": "int8",
    "model": "",
    "model2": "",
    "vad": "alifsmnvad-onnx",
    "punc": "alicttransformerpunc-zh-en-mge-int8-onnx",
    "base": "",
    "output": ""
  }
}

Описание поля конфигурации

поле	описание	параметр 发电影全行行	значение по умолчанию
`method`	метод обработки	`-m, --method`	`chunk`
`input`	источник входного сигнала	`-i, --input`	`file`
`format`	выходной формат	`--format`	`text`
`threads`	电影数(0=автоматическое обнаружение)	`--threads`	`2`
`accuracy`	точность модели	`--accuracy`	`int8`
`model`	основное название модели	`-md, --model`	`""`(автоматическое сопоставление)
`model2`	2-проходная модель	`--model2`	`""`(автоматическое сопоставление)
`vad`	Название модели ВАД	`--vad`	`alifsmnvad-onnx`
`punc`	название модели	`--punc`	`alicttransformerpunc-zh-en-mge-int8-onnx`
`base`	корневой каталог модели	`-b, --base`	`""`（каталог программ）
`output`	рабочий каталог	`-o, --output`	`""`(текущий каталог)

конфигурация управления командами

команда	описание	пример
`--show-config`	Показать текущую информацию о конфигурации	`manyspeech --show-config`
`--save-default`	Сохранить текущие параметры как конфигурацию по умолчанию.	`manyspeech -t offline -m chunk --save-default`
`--reset-config`	Установить по умолчанию	`manyspeech --reset-config`

发动电影电影 (от высокого к низкому)

命令行参数（临时覆盖，最高优先级）
        ↓
    --save-default 保存的参数
        ↓
    本地配置文件（程序目录/manyspeech.json）
        ↓
    用户配置文件（%USERPROFILE%\.manyspeech\manyspeech.json）
        ↓
    系统配置文件（%PROGRAMDATA%\ManySpeech\manyspeech.json）
        ↓
    环境变量（MANYSPEECH_*）
        ↓
    程序内置默认值（最低优先级）

Пример использования конфигурации

# 查看当前配置
manyspeech --show-config

# 输出示例：
========== 当前配置 ==========
配置文件: D:\Tools\manyspeech.json
总运行次数: 15
上次运行: 2026-01-15 10:35:00

默认配置:
  method: chunk
  input: file
  format: srt
  threads: 4
  accuracy: int8
  base: D:\MyModels
  output: D:\Output
...

# 保存当前参数为默认配置
manyspeech -t offline -m chunk --format srt --threads 4 --save-default
✅ 当前参数已保存为默认配置

# 之后直接运行，自动使用保存的默认值
manyspeech -f test.wav

# 重置配置
manyspeech --reset-config
✅ 配置已重置为默认值

`-b, --base` конфигурация каталога моделей

Каталог моделей можно указать следующим образом:

приоритет	метод конфигурации	пример
1	командная строка `-b` параметры	`manyspeech -t offline -b D:\MyModels -f test.wav`
2	в файле конфигурации `base` поле	редактировать `manyspeech.json` 中国 `"base": "D:\\MyModels"`
3	переменная среда `MANYSPEECH_BASE`	`set MANYSPEECH_BASE=D:\MyModels`
4	программы каталогов по умолчанию	каталог программ

# 方式1：命令行指定（临时）
manyspeech -t offline -b D:\TempModels -f test.wav

# 方式2：配置文件指定（永久）
# 编辑 manyspeech.json
{
  "defaults": {
    "base": "D:\\MyModels"
  }
}
manyspeech -t offline -f test.wav   # 自动使用 D:\MyModels

# 方式3：环境变量指定
set MANYSPEECH_BASE=D:\MyModels
manyspeech -t offline -f test.wav

`-o, --output` конфигурация каталога заданий

Рабочий каталог (результаты идентификации магазина, журналы, временные документы и т.п.) можно указать следующим образом:

приоритет	метод конфигурации	пример
1	командная строка `-o` параметры	`manyspeech -t offline -o D:\MyOutput -f test.wav`
2	в файле конфигурации `output` поле	редактировать `manyspeech.json` 中国 `"output": "D:\\MyOutput"`
3	переменная среда `MANYSPEECH_OUTPUT`	`set MANYSPEECH_OUTPUT=D:\MyOutput`
4	программы каталогов по умолчанию	Текущий каталог

# 方式1：命令行指定（临时）
manyspeech -t offline -o D:\TempOutput -f test.wav

# 方式2：配置文件指定（永久）
# 编辑 manyspeech.json
{
  "defaults": {
    "output": "D:\\MyOutput"
  }
}
manyspeech -t offline -f test.wav   # 自动输出到 D:\MyOutput

# 方式3：环境变量指定
set MANYSPEECH_OUTPUT=D:\MyOutput
manyspeech -t offline -f test.wav

💡 Типичный пример использования

1. 长长长离线流式动线 · 电影字幕

# FireRedASR 大模型（中文最佳，高精度）
manyspeech -t offline -m chunk --format srt --threads 4 -f "D:\audio\0.wav" --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212

# FunASR 轻量模型（速度快，资源占用低）
manyspeech -t offline -m chunk --format srt --threads 2 -f "D:\audio\0.wav" --model Fun-ASR-Nano-2512-LLM-int8-onnx

# Paraformer 大模型（通用场景，平衡精度与速度）
manyspeech -t offline -m chunk --format srt --threads 4 -f "D:\audio\0.wav" --model paraformer-large-wenetspeech-chuan-int8-onnx-offline

# Whisper large（多语言支持）
manyspeech -t offline -m chunk --format srt --threads 8 -f "D:\audio\0.wav" --model whisper-large-v3-turbo-int8-onnx-kv

# K2Transducer 轻量模型（实时性强，适合长音频）
manyspeech -t offline -m chunk --format srt --threads 2 -f "D:\audio\0.wav" --model k2transducer-zipformer-ctc-small-zh-int8-onnx-offline-20250716

2. Микрофоны для микрофона · 电影字幕

# FireRedASR 大模型（高精度，适合会议记录）
manyspeech -t offline -m chunk --format srt --threads 4 -i mic --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212

# FunASR 大模型（高精度，适合会议记录）
manyspeech -t offline -m chunk --format srt --threads 2 -i mic --model Fun-ASR-Nano-2512-LLM-int8-onnx

# Paraformer 轻量模型（低延迟，适合实时转录）
manyspeech -t offline -m chunk --format srt --threads 4 -i mic --model paraformer-large-zh-en-timestamp-int8-onnx-offline

# SenseVoiceSmall 小模型（低延迟，适合实时转录）
manyspeech -t offline -m chunk --format srt --threads 2 -i mic --model sensevoice-small-int8-onnx

3. Распознавание микрофона в реальном времени · Генерация в реальном времени 字幕

# Paraformer 流式模型（通用流式识别，稳定性好）
manyspeech -t online --format srt -i mic --model paraformer-large-zh-en-int8-onnx-online

# K2Transducer 大模型（中文流式，精度高）
manyspeech -t online --format srt -i mic --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630

# K2Transducer 超大模型（中文流式，极致精度，推荐高性能设备）
manyspeech -t online --format srt -i mic --model k2transducer-zipformer-ctc-xlarge-zh-onnx-online-yuekai-20250630

# K2Transducer 英文模型（英文通用）
manyspeech -t online --format srt -i mic --model k2transducer-zipformer-en-int8-onnx-online-zengwei-20230517

# Wenet 流式模型（中文通用）
manyspeech -t online --format srt -i mic --model wenet-u2pp-conformer-wenetspeech-int8-onnx-online-20220506

# Wenet 英文模型（英文通用）
manyspeech -t online --format srt -i mic --model wenet-u2pp-conformer-gigaspeech-onnx-online-20210728

# Whisper tiny 轻量模型（多语言）
manyspeech -t offline --format srt -i mic --model whisper-tiny-int8-onnx-kv

4. 2 прохода 双流联名名种 · 时间精修

# Paraformer 2pass（实时输出 + 最终精修）
manyspeech -t 2pass -i mic --model paraformer-large-zh-en-int8-onnx-online --model2 paraformer-seaco-large-zh-timestamp-int8-onnx-offline

# K2Transducer 2pass（流式实时 + 离线精修）
manyspeech -t 2pass -i mic --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630 --model2 k2transducer-zipformer-ctc-small-zh-int8-onnx-offline-20250716

# Wenet 2pass（流式实时 + 离线精修）
manyspeech -t 2pass -i mic --model wenet-u2pp-conformer-wenetspeech-onnx-online-20220506 --model2 wenet-u2pp-conformer-wenetspeech-int8-onnx-offline-20220506

📚 Список поддерживаемых моделей

Больше моделей, пожалуйста, обратитесь к:

https://modelscope.cn/profile/manyeyes?tab=model

⚙️ подробное описание параметров

Базовые опции

параметры	описание	значение по умолчанию	переменная среда
`-t, --type`	определить тип	—	`MANYSPEECH_TYPE`
`-m, --method`	метод обработки	`chunk`	`MANYSPEECH_METHOD`
`-i, --input`	Источник входного сигнала: аудиофайл/микрофон.	`file`	`MANYSPEECH_INPUT`
`-b, --base <路径>`	корневой каталог модели	каталог программы	`MANYSPEECH_BASE`
`-o, --output <目录>`	Рабочий каталог	Текущий каталог	`MANYSPEECH_OUTPUT`
`-md, --model <名称>`	основное название модели	Автоматическое сопоставление	`MANYSPEECH_MODEL`
`--model2 <名称>`	2 прохода	Автоматическое сопоставление	`MANYSPEECH_MODEL2`
`--vad <名称>`	Модель обнаружения речи VAD	`alifsmnvad-onnx`	`MANYSPEECH_VAD`
`--punc <名称>`	восстановить тег модели	`alicttransformerpunc-zh-en-mge-int8-onnx`	`MANYSPEECH_PUNC`
`--accuracy`	точность модели	`int8`	`MANYSPEECH_ACCURACY`
`--threads <数量>`	推理电视数,0= автоматическое обнаружение	`2`	`MANYSPEECH_THREADS`
`--format`	выходной формат	`text`	`MANYSPEECH_FORMAT`
`-f, --files <文件...>`	Чтобы распознать аудиофайл (поддержка нескольких файлов)	—	—

настроить параметры управления

параметры	описание
`--show-config`	Показать текущую информацию о конфигурации
`--save-default`	Сохранить текущие параметры как конфигурацию по умолчанию.
`--reset-config`	Установить по умолчанию

список переменных среды

переменная среда	соответствующие параметры
`MANYSPEECH_TYPE`	`-t, --type`
`MANYSPEECH_METHOD`	`-m, --method`
`MANYSPEECH_INPUT`	`-i, --input`
`MANYSPEECH_BASE`	`-b, --base`
`MANYSPEECH_OUTPUT`	`-o, --output`
`MANYSPEECH_MODEL`	`-md, --model`
`MANYSPEECH_MODEL2`	`--model2`
`MANYSPEECH_VAD`	`--vad`
`MANYSPEECH_PUNC`	`--punc`
`MANYSPEECH_ACCURACY`	`--accuracy`
`MANYSPEECH_THREADS`	`--threads`
`MANYSPEECH_FORMAT`	`--format`

Параметр скорости

-t = --type
-m = --method
-i = --input
-b = --base
-o = --output
-md = --model
-f = --files

📖 Подробное руководство по использованию

1. Описание правил по умолчанию

не указан -model При автоматическом использовании модели по умолчанию
по умолчаниюАвтоматическое включение VAD断句 + 梦点时间
указанный --format srt Может генерировать стандартный документ 字幕.
При отсутствии модели программа автоматически загрузится в фоновом режиме.
файл конфигурации: Автоматическое создание впервые, можно редактировать для изменения параметров по умолчанию.

2. Быстрый опыт самой удобной команды

# 非流式识别（使用默认模型、默认测试音频）
manyspeech -t offline

# 实时流式识别（麦克风）
manyspeech -t online -i mic

# 2pass 双流融合识别
manyspeech -t 2pass -i mic

3. Локальное распознавание аудиофайлов.

# 单文件识别
manyspeech -t offline -f meeting.wav

# 多文件批量识别
manyspeech -t offline -f meeting1.wav meeting2.wav meeting3.wav

# 分片处理长音频（建议配合VAD，精度更高）
manyspeech -t offline -m chunk -f long_audio.wav

# 流式模型识别本地文件
manyspeech -t online -m chunk -f audio.wav

# 输出JSON格式（含时间戳）
manyspeech -t offline --format json -f audio.wav

# 指定输出目录
manyspeech -t offline -f audio.wav -o D:\Output

4. микрофон распознавания в реальном времени

# 流式模型 + 麦克风（延迟最低，约200ms）
manyspeech -t online -i mic

# 离线模型 + 麦克风（精度更高，约1-2秒延迟）
manyspeech -t offline -m chunk -i mic

# 2pass 模式 + 麦克风（首次实时输出，最终精修）
manyspeech -t 2pass -i mic

# 指定VAD模型
manyspeech -t online --vad silero-vad-v6-onnx -i mic

# 实时输出SRT字幕
manyspeech -t online --format srt -i mic

5. VAD/стандартная модель 启停与电影

# 禁用 VAD 和标点（原始识别结果）
manyspeech -t offline --vad "" --punc ""

# 切换 Silero VAD（更适合嘈杂环境）
manyspeech -t offline --vad silero-vad-v6-onnx -f audio.wav

# 使用默认 FSMN VAD（速度快，适合清晰语音）
manyspeech -t offline --vad alifsmnvad-onnx -f audio.wav

# 仅禁用标点，保留VAD
manyspeech -t online --punc "" -i mic

6. Формат вывода

# 输出 SRT 字幕（最常用）
manyspeech -t offline -m chunk --format srt -f audio.wav
# 生成 audio.srt 文件

# 输出 WebVTT 字幕（网页使用）
manyspeech -t offline --format vtt -f audio.wav
# 生成 audio.vtt 文件

# 输出 JSON 格式（程序解析）
manyspeech -t offline --format json -f audio.wav
# 输出结构化 JSON，含文本、时间戳、置信度

# 输出纯文本（默认）
manyspeech -t offline -f audio.wav
# 直接输出识别文字

7. Вручную укажите любую модель

# 查看可用模型：https://modelscope.cn/profile/manyeyes?tab=model

# SenseVoice 小模型（轻量快速）
manyspeech -t offline -i mic --model sensevoice-small-int8-onnx

# Whisper tiny（英文优化）
manyspeech -t offline -f english.wav --model whisper-tiny-en-onnx

# Whisper large（多语言高精度）
manyspeech -t offline -f multilingual.wav --model whisper-large-v3-turbo-zh-onnx-belle-20241016

# FireRedASR 大模型（中文最佳）
manyspeech -t offline -m chunk --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212 -f chinese.wav

# Paraformer 大模型（通用场景）
manyspeech -t offline -m chunk --model paraformer-large-zh-en-int8-onnx-offline -f general.wav

# K2Transducer 模型（实时性强）
manyspeech -t online -i mic --model k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630

# 2pass 模式指定副模型
manyspeech -t 2pass -i mic --model paraformer-large-zh-en-int8-onnx-online --model2 paraformer-seaco-large-zh-timestamp-int8-onnx-offline

8. Конфигурация переменных среды (подходит для высокочастотных сцен)

# Windows cmd
set MANYSPEECH_TYPE=online
set MANYSPEECH_METHOD=chunk
set MANYSPEECH_THREADS=4
set MANYSPEECH_FORMAT=srt
set MANYSPEECH_OUTPUT=D:\Output
manyspeech -i mic

# Windows PowerShell
$env:MANYSPEECH_TYPE="online"
$env:MANYSPEECH_METHOD="chunk"
$env:MANYSPEECH_THREADS="4"
$env:MANYSPEECH_FORMAT="srt"
$env:MANYSPEECH_OUTPUT="D:\Output"
manyspeech -i mic

9. Пример интерактивного режима завершен.

# 启动交互模式
manyspeech

# 会话示例：
=====================================
请输入参数 (输入 'exit' 退出，直接回车显示帮助):

# 识别单个文件
> -t offline -f D:\test.wav
[识别结果...]

# 批量识别
> -t offline -f 1.wav 2.wav 3.wav --format srt
[生成3个字幕文件...]

# 麦克风实时识别
> -t online -i mic
[按 ESC 退出...]

# 指定模型识别
> -t offline -i mic --model fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212

# 指定输出目录
> -t offline -f test.wav -o D:\MyOutput

# 查看配置
> --show-config

# 保存当前参数为默认
> -t offline -m chunk --format srt --save-default

# 查看帮助
> --help

# 退出
> exit

10. Пример сценария пакетной обработки

# Windows批处理脚本 (batch_process.bat)
@echo off
setlocal enabledelayedexpansion

set INPUT_DIR=D:\audio
set OUTPUT_DIR=D:\output

for %%f in ("%INPUT_DIR%\*.wav") do (
    echo Processing %%f...
    manyspeech -t offline -m chunk --format srt --threads 4 -f "%%f" -o "%OUTPUT_DIR%"
)

echo All files processed!
pause

# PowerShell 脚本 (batch_process.ps1)
$inputDir = "D:\audio"
$outputDir = "D:\output"

Get-ChildItem $inputDir -Filter *.wav | ForEach-Object {
    Write-Host "Processing $($_.Name)..."
    & manyspeech -t offline -m chunk --format srt --threads 4 -f $_.FullName -o $outputDir
}

Write-Host "All files processed!"

📌дополнительное объяснение

Определите тип подробно

тип	описание	применимый сценарий
`offline`	非流式动行,推车设计аудиопосле вывода	Распознавание документов, длинный звук, удаленная сцена
`online`	Распознавание в реальном времени, 边较边出字	микрофон, прямая трансляция, сцена с низкой задержкой
`2pass`	双流结果名种, вывод в реальном времени + окончательный результат	Существуют сценарии, требующие точности и режима реального времени.

Подробный формат вывода

формат	описание	использует
`text`	Чистый текст, 每句一行	Быстрый просмотр, запись журнала
`json`	Формат JSON.	电影解析、вторичная обработка
`srt`	Формат SubRip	Программное обеспечение для редактирования видео
`vtt`	Формат WebVTT	Веб-браузер, браузер

Подробный метод обработки

манера	описание	применимый сценарий
`one`	Однократная обработка всего аудио	Короткое аудио, быстрый тест
`batch`	Пакетная обработка нескольких полных аудиофайлов	Пакетная обработка нескольких файлов
`chunk`	分礼流式电影	Длинный звук, потоковая передача в реальном времени

Внимание

файл конфигурации: Первый запуск генерируется автоматически. manyspeech.json，можно редактировать для изменения параметров по умолчанию
загрузка модели: При отсутствии модели программа автоматически загружается в фоновом режиме, ручная установка не требуется (более крупные модели, сначала загрузите
LFS мерзавец: Установка Git LFS, автоматическая обработка (программа и автоматическая обработка)
2pass Основная модель-онлайн-модель, вторая модель model2 для проводной модели
распознавание микрофонапроцесс клавиша ESC ты можешь выйти
команда:--help 或 -h Вы можете просмотреть полное описание параметра
название модели: Название модели можно получить на страницах ModelScope.

🔗 ссылка на проект

Многие страницы речи

Source link

Лос-Анджелес Лейкерс

Administrator

Visit Website View All Posts

Leave a Reply Cancel reply

Related Stories

博彩公司封盤傳卡域克快將坐正

拆新视鋪新草美國首擊場館赶得切翻新？

Когда ИИ запускает код, можете ли вы гарантировать, что он не развернется? – SharpCJ

You May Have Missed