-
Notifications
You must be signed in to change notification settings - Fork 120
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[project-s] Core APIを用意する #712
Comments
issueまとめ助かります!!
良さそうに感じました!
たしかにどう実装すべきかパッとわからないですね・・・。 あと内部での持ち方に加えて、ファイルとしてどう持つのか、エンジンにどう伝えるのかも考慮ポイントかなと感じました! |
確かに、少なくとも
これは0.14時点では
たしかに、これは少し考える必要がありそうです。 |
たしかにです! 賛成です。
こちらも同感です!
考えてたのですが、speakerとsing_speakerを分けるのは避けるべきな気がしました! まだ考えきれてないのですが、一旦sing関係なく、モデルの能力とかモデルのタイプをmetas.jsonのスタイルごとに書くとかどうでしょう? ただ、能力とタイプを両方書くべきなのか、片方で良いのかとかはちゃんと考えきれてないです。。。 |
こちら一旦完了かなと思うのでclose します!お疲れ様でした!! でもまあ多分もっと API 増やしたいんですよね。ありはインターフェイスを変えるか。 |
内容
本Issueはproject-s用です。
project-s向けに、VOICEVOX Coreに対して「f0輪郭(フレームf0)予測」と「フレーム音量予測」、「子音長予測」、「長音対応decoder」のモデルを導入し、C APIでインターフェースを用意したいです。
少し急ですが、今月中に用意したいため、最新のmainから派生するのではなくて、現状の
project-s
ブランチの状態である0.14派生から作りたいです。また、実装の速さ重視で、今までと同様のAPIのほうがエンジンから扱いやすい関係上、新APIの方を一旦無視して(0.15から大きく変わるので、0.14時点のところに生やしてもあまり意味がないという認識です)
compatible_engine.rs
にだけAPIを生やして運用したいです。今のところ、f0輪郭予測については
predict_contour
/yukarin_sosf_forward
として生えていますが、フレーム音量予測に合わせてpredict_frame_f0
に改名・統一し、それ以外はpredict_frame_volume
、predict_consonant_length
、source_filter_decode
でインターフェース名をそろえようかなと。インターフェースは一旦これでいいと考えているのですが、内部でのモデルの持ち方を少し検討中です。将来的にはvvmにすることになると思うのですが、今みたいに
models
として統一して持つと、上記のproject-s用特殊モデルがあるもの・ないものが同時に共存して、扱いに困る気がしています。もちろん、一部モデルをオプショナルにして統一して持つのもいい気はするのですが、project-sモデルとttsモデルは必要なモデルがほぼ排反になるはずなので、別でモデルを持つ場所を用意したほうがいいのかなーと...!
かなり急ではあるのですが、 @qryxip さん、ご意見いただけると非常に助かります...!
Pros 良くなる点
project-sが進行する
Cons 悪くなる点
特になし...?
The text was updated successfully, but these errors were encountered: