Show newer

おっとReazonSpeechのPythonのライブラリを見たら頭に0.9秒の余白付け足してから認識させてんじゃん
これか~

発話の認識は上手くいってるっぽいな
音声認識の方がなぜか頭の方無視しがちのようだ
俺のしゃべりが問題な可能性も十分あるけども

ライブラリに渡すパラメータもほんとにこれであってるのかわからんのでソースを見たいんだが、ソースがどこにあるかわからない
GitHubのリポジトリのURLが貼られてるけどほんとにそこにある~?

VADの設定の意味が書いてなくてよくわからん

オーバーフローで終了するのは単に間に合ってないだけだと思われるので頭の方が切れるのだけなんとかしたい

うーん発話の頭の方が無視されちゃうのと長々としゃべるとオーバーフローとかで終了しちゃう問題があるものの、認識自体は精度よさそう

そこそこちゃんと動くけども最初の方が認識してくれないのとオーバーフローで落ちちゃう
なんかサンプルに不備ありそう?

サンプルを見てたら普通に発話認識して都度音声認識するやつあるじゃん
VADってのがしゃべってる区間認識するやつなんだな

いやオンラインじゃねえな普通にオフラインだった

ん?普通にsherpa-onnxが独自に変換したっぽいReazonSpeechのオンライン用モデルってのがあるな
これ試してみるか

音声の切り出し自体はそこまで大変ではないっぽい
でも実用するにはそんな単純にはいかねえんじゃねえのという感じあるね

なんとか頑張って発話の開始から終了を検出してそこだけ切り出して認識させればいいのか~
大変だ~

試してみたらなんかエラー出るので調べたら、ReazonSpeechのモデルはオフライン用なのでリアルタイム音声認識には使えないっぽい
残念

Show thread

みずほのネットバンキングが大幅に見た目変わっててびっくりしつつもそんなこと言ってたなと
そして投資信託の画面を開いたらリニューアルしたはずなのに今までとほぼ同じ画面が出てきてギャップにまたびっくりした

アクリジョンだの水性ホビーカラーだのを水性ウェザリングペイント専用うすめ液で薄めると楽にスミ入れできたことをここにおしらせします

CD取り込みも全然急がんしわざわざ体調悪いときにでかけるものじゃないな
今日はでかけない

どうせ出るなら秋葉原まで行ってもいいんだが、そもそも外出るのがおっくう

まだ体調よくないしあとはおうちでゆっくりするつもりだったけど、CD取り込むのにCDファイル必要なんだった
買いに行くのもめんどいなあ……

14時台で全滅なのを確認できてよかった
なんか前回は17時近くまで頑張ってたもんな~

DMM通販の抽選とキャンセル待ちに賭けましょう
分は悪くないはずだ

Show older
7144.party

7144民向け