AquesTalkライク記法によるTTS関数の追加とそれに伴うバグの修正 #101

y-chan · 2022-03-16T08:24:15Z

内容

題の通りです。
元々AquesTalkライク記法を解釈するための関数(parse_kana)を備えていましたが、それが盛大にバグを含んでいたので、同時に修正です。

こちらに動作確認用のテストコードを置いています。
https://gist.github.com/y-chan/91f180f525be2415f7785b545e5011c1

Hiroshiba

@Yosshi999 さん、 @Oyaki122 さん、 @qwerty2501 さん、もしよければレビューお願いできるととても嬉しいです･･･！

qwerty2501

このPRでやることではないかもしれないですがテストコードがほしいですね
SuggestしてますがSuggestだけだとコンパイル通らなくなるかもなので適宜直していただければ

core/src/engine/kana_parser.cpp

core/src/engine.cpp

core/src/engine/kana_parser.cpp

core/src/engine/kana_parser.h

y-chan · 2022-03-18T14:27:04Z

size_tの利用、ポインタ渡しから参照渡しへの変更等行ってみました。
個人的には型が明示されている方が良いので、ここではautoには書き換えずそのままにしておきました。

qwerty2501 · 2022-03-18T17:33:12Z

LGTM

Hiroshiba · 2022-03-19T04:53:33Z

core/src/core.h

+ * @param output_wav 音声データを出力する先のポインタ。使用が終わったらvoicevox_wav_freeで開放する必要がある
+ * @return 結果コード
+ */
+VOICEVOX_CORE_API VoicevoxResultCode voicevox_tts_from_aquestalk_notation(const char *text, int64_t speaker_id,


あ、念の為にaquestalkは関数名に含めない方針にしておくとトラブルが無くてよいのかなと感じました！
エンジンのときは kana 引数だったので、真似ると from_kana とか･･･？

確かにそうですね...!
変更しておきました！

Hiroshiba

LGTM！！（たぶん）

たしかにそろそろテストがほしいなと感じました！

Hiroshiba · 2022-03-19T05:37:20Z

core/src/engine/kana_parser.cpp

+    size_t char_size;
+    std::string letter = extract_one_character(phrase, base_index, char_size);


char_sizeは返り値ですよね、一般的じゃないのかもですがstd::pairやtupleでreturnすれば左辺に書けるので見やすくなるのかもと思いました。
たぶんこう書けるはず

auto [letter, char_size] = extract_one_character(phrase, base_index)

それをやるのであれば、専用のreturn用のstructや構造体を作ったほうがわかりやすいのではないですか？
tupleなどは型情報しか示せるものがないので何番目のfieldが何を示しているかがわかりにくいと思います。

変数名になるかフィールド名になるかの違いなので、実装されてさえいればまあどっちでもいいのかなと思いました。

変数名になるかフィールド名になるかの違いなので、まあどっちでもいいのかなと思いました。

結構違いはあります。
tupleで返して変数で受け取る場合、呼び出し側が適切に意味を理解して明示的に変数名をつけなくてはなりません。
対してstructで返す場合field名をつけるのは関数実装者のためその関数を呼び出す側はfield名を見るだけでそれがどういった意味を持っているか知ることができます。
これは例えば新規で開発に携わる人が何も知らない状態で extract_one_character を呼び出す場合にその戻り値がどういった意味を持っているか理解する手助けにはなります。
もちろんtupleで返す実装の方が extract_one_character を実装する側は楽だとは思いますが

私見なので私の意見を採用するかはおまかせといった感じです！ 👍

ちなみにC++の場合参照を渡すほうが適切な場合もあります。戻り値のサイズが大きすぎる場合。
今回はそこまでサイズは大きくないのでその必要はないと思いますが

ちなみに理由は、　Hoge hoge = hogeFunc()　だとコピーが発生するためでしょうか？
初期化の際はstd::moveになるのかなと思っていたのですが、もしかして関数の戻り値は初期化の際もコピー･･･？

ちょっと説明がややこしいんですが、結論から言うとコピーが発生するためですね。

初期化の際はstd::moveになるのかなと思っていたのですが、もしかして関数の戻り値は初期化の際もコピー･･･？

正確にはstd::moveになるではなくて右辺値になるですね。まあmoveされた結果右辺値になるので概ね解釈としてはあってると思います。これは関数の戻り値も同様です。
上記の例だと例えばHoge classにstringやvectorのフィールドがあったとしてもその各フィールドで確保されてるheap領域についてはmoveされるのでコピーは発生しません。
しかしスタックメモリの実装上関数が終わるとその関数のスタック領域は破棄されてしまうので hogeFunc の戻り値の型がポインタや参照でもなく Hoge そのものを返すものだった場合どうしても hogeFunc のスタック領域から呼び出し側のスタック領域へのコピーは発生してしまいます。そのため Hoge classのフィールドがint64のものを沢山持っているなどclassのサイズが大きな場合はC++でも出力用の引数を参照で受け取るような実装はありえます。
もちろん hogeFunc の戻り値の型を unique_ptr<Hoge> といった風にheap領域で確保した状態でreturnするという回避方法もあります。(このプロジェクトだとこっちのほうがあってるかも)

おお、なるほどです。
最近のコンパイラだとスタック領域の移動がなくなるようにコンパイルしてくれたり･･･？
だとしてもコンパイラ依存になっちゃうので、明示的にunique_ptr使ったりしたほうが良さそうに感じます。
勉強になりました。

後から見る方のメモとして、結論としては、実装者に依存してpairで返すのも構造体で返すのもどっちでも良いという感じです！

y-chan added 8 commits March 16, 2022 01:06

aquestalk notation

12afd2f

format

2b9e9be

add extract one character func

d466f39

use extract one character func and fix bug

75b780c

fix segmentation fault

62332e3

fix pause delimiter/no pause delimiter bug

859a0b1

refactor (remove double quote)

cf52021

refactor

ec831f7

Hiroshiba reviewed Mar 17, 2022

View reviewed changes

qwerty2501 reviewed Mar 17, 2022

View reviewed changes

use size_t

b68adc3

qwerty2501 approved these changes Mar 18, 2022

View reviewed changes

Hiroshiba reviewed Mar 19, 2022

View reviewed changes

y-chan added 2 commits March 19, 2022 14:21

format

c4fbe34

fix func name

496910e

Hiroshiba approved these changes Mar 19, 2022

View reviewed changes

Hiroshiba merged commit beee7ca into VOICEVOX:cpp-library Mar 19, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

AquesTalkライク記法によるTTS関数の追加とそれに伴うバグの修正 #101

AquesTalkライク記法によるTTS関数の追加とそれに伴うバグの修正 #101

y-chan commented Mar 16, 2022 •

edited

Loading

Hiroshiba left a comment

qwerty2501 left a comment •

edited

Loading

y-chan commented Mar 18, 2022

qwerty2501 commented Mar 18, 2022

Hiroshiba Mar 19, 2022

y-chan Mar 19, 2022

Hiroshiba left a comment

Hiroshiba Mar 19, 2022

qwerty2501 Mar 19, 2022

Hiroshiba Mar 19, 2022

Hiroshiba Mar 19, 2022

qwerty2501 Mar 19, 2022

qwerty2501 Mar 19, 2022

qwerty2501 Mar 19, 2022 •

edited

Loading

Hiroshiba Mar 19, 2022

qwerty2501 Mar 19, 2022

Hiroshiba Mar 19, 2022

		size_t char_size;
		std::string letter = extract_one_character(phrase, base_index, char_size);

AquesTalkライク記法によるTTS関数の追加とそれに伴うバグの修正 #101

AquesTalkライク記法によるTTS関数の追加とそれに伴うバグの修正 #101

Conversation

y-chan commented Mar 16, 2022 • edited Loading

内容

Hiroshiba left a comment

Choose a reason for hiding this comment

qwerty2501 left a comment • edited Loading

Choose a reason for hiding this comment

y-chan commented Mar 18, 2022

qwerty2501 commented Mar 18, 2022

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Hiroshiba left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

qwerty2501 Mar 19, 2022 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

y-chan commented Mar 16, 2022 •

edited

Loading

qwerty2501 left a comment •

edited

Loading

qwerty2501 Mar 19, 2022 •

edited

Loading