Cubase / ARA Lyrics Workflow

把识别、搜词、时间线和编辑放进同一条歌词工作流

按当前工程代码,LrcSyn 实际是一条围绕 Cubase / ARA、插件端、本地识别 worker、 自动搜词、逐字时间线、UVR 提干声和时间戳编辑建立起来的完整工作流, 而不是一个只负责显示歌词的小工具。

录音师在控制室进行制作与编辑工作
宿主定位 Cubase / VST3 / ARA
识别主链 本地 worker + faster-whisper
增强能力 自动搜词 + UVR 提干声
结果形式 逐字时间线 + 编辑波形

Why It Exists

它解决的不是“能不能识别”,而是“歌词工作流顺不顺”

逐字时间线难做

真正难的不是出一份转写文本,而是把歌词、时间线、显示效果和交付要求统一起来。

项目一多就容易返工

如果时间线和歌词链路不稳定,最后返工的通常不是一句话,而是整段逐字和对齐效果。

编辑与修正才是高频工作

专业用户更需要可修、可看、可继续调整的工作流,而不是一次性跑完后没法继续用。

Actual Workflow

按当前代码,LrcSyn 的真实功能链路是这样的

插件运行在 Cubase / ARA 环境中,识别任务交给本地 worker, 最终返回可继续编辑的 `lrcsyn-json-v1` 时间线。

核心工作流程

  • 插件在 Cubase / ARA 中直接围绕音频事件工作
  • 本地 worker 通过 `127.0.0.1:8765` 执行识别,不靠纯云端识别主链
  • 识别主链使用 `faster-whisper`,结果以 `lrcsyn-json-v1` 时间线回到插件
  • 插件会自动联网搜词,并保留候选歌词与参考歌词链路

为什么这点重要

这说明 LrcSyn 的定位不是“单次转写”,而是把识别、搜词、显示和继续编辑串成一条长期可用的工程流程。

控制室工作环境与屏幕操作场景
录音项目中的歌手录音场景

Confirmed Features

从代码里能确认的主要功能

识别、搜词与逐字时间线

  • 插件渲染歌词与逐字染色
  • 支持自动搜词候选,不会直接粗暴覆盖原始识别
  • 识别完成后返回逐字时间线,用于后续显示和修正
  • 支持 ARA 事件导出与重新识别工作链路

时间戳编辑与波形辅助

  • 支持时间戳编辑模式、行内时间调整与点击/拖动 seek
  • 编辑模式可显示背景波形,帮助对齐和修正时间线
  • 波形与时间线会做缓存和持久化,适合持续修整项目
  • 支持在编辑模式中保持状态,不是临时演示性质的 UI

UVR 提干声识别

  • worker 已接入 UVR 分离链,可先提干声再识别
  • 支持保存 `Vocals / Instrumental` 结果路径与复用缓存
  • 可在后续识别中复用分离结果,减少重复处理
  • 适合素材复杂或需要提高识别质量的项目

主要使用场景

  • 录音棚项目中的歌词同步与交付整理
  • Cubase / ARA 环境中的逐字歌词时间线制作
  • 需要搜词、修正、校时而不是只要一份转写结果的项目
  • 适合录音棚同行,也适合重视成品质量的个人用户

Advantages

这个工具最真实的优点

01

不是只做识别

它把识别、搜词、逐字显示、编辑和缓存都放进同一条链路,适合实际交付工作。

02

更贴近 Cubase / ARA 使用习惯

它直接围绕 ARA 音频事件和宿主时间线工作,而不是脱离工程环境单独处理。

03

适合持续修整项目

时间线、波形、搜词和提干声结果都有缓存与持久化设计,不是一次性结果页。

04

从真实场景长出来

这条产品线本身就是围绕录音棚实际工作流持续迭代出来的,不是脱离业务场景的演示工具。

Go To Product

如果你也想让歌词同步流程真正进入工程状态

LrcSyn 更适合那些已经在做真实项目的人。它解决的是“整条歌词工作流能不能顺起来”, 而不是只解决某一个很孤立的按钮功能。

Demo Focus

后续最值得补上的界面演示内容

优先补这几类截图

  • Cubase / ARA 插件主界面
  • 自动搜词候选与参考歌词结果
  • 逐字时间线与逐字染色效果
  • 时间戳编辑模式与波形背景

为什么这些图最重要

LrcSyn 的价值很大一部分体现在“工作流细节”,所以真实界面截图会比单纯空间图更能说明产品能力。