おっとReazonSpeechのPythonのライブラリを見たら頭に0.9秒の余白付け足してから認識させてんじゃんこれか~
発話の認識は上手くいってるっぽいな音声認識の方がなぜか頭の方無視しがちのようだ俺のしゃべりが問題な可能性も十分あるけども
ライブラリに渡すパラメータもほんとにこれであってるのかわからんのでソースを見たいんだが、ソースがどこにあるかわからないGitHubのリポジトリのURLが貼られてるけどほんとにそこにある~?
VADの設定の意味が書いてなくてよくわからん
オーバーフローで終了するのは単に間に合ってないだけだと思われるので頭の方が切れるのだけなんとかしたい
うーん発話の頭の方が無視されちゃうのと長々としゃべるとオーバーフローとかで終了しちゃう問題があるものの、認識自体は精度よさそう
そこそこちゃんと動くけども最初の方が認識してくれないのとオーバーフローで落ちちゃうなんかサンプルに不備ありそう?
サンプルを見てたら普通に発話認識して都度音声認識するやつあるじゃんVADってのがしゃべってる区間認識するやつなんだな
いやオンラインじゃねえな普通にオフラインだった
ん?普通にsherpa-onnxが独自に変換したっぽいReazonSpeechのオンライン用モデルってのがあるなこれ試してみるか
音声の切り出し自体はそこまで大変ではないっぽいでも実用するにはそんな単純にはいかねえんじゃねえのという感じあるね
なんとか頑張って発話の開始から終了を検出してそこだけ切り出して認識させればいいのか~大変だ~
試してみたらなんかエラー出るので調べたら、ReazonSpeechのモデルはオフライン用なのでリアルタイム音声認識には使えないっぽい残念
みずほのネットバンキングが大幅に見た目変わっててびっくりしつつもそんなこと言ってたなとそして投資信託の画面を開いたらリニューアルしたはずなのに今までとほぼ同じ画面が出てきてギャップにまたびっくりした
アクリジョンだの水性ホビーカラーだのを水性ウェザリングペイント専用うすめ液で薄めると楽にスミ入れできたことをここにおしらせします
CD取り込みも全然急がんしわざわざ体調悪いときにでかけるものじゃないな今日はでかけない
どうせ出るなら秋葉原まで行ってもいいんだが、そもそも外出るのがおっくう
まだ体調よくないしあとはおうちでゆっくりするつもりだったけど、CD取り込むのにCDファイル必要なんだった買いに行くのもめんどいなあ……
14時台で全滅なのを確認できてよかったなんか前回は17時近くまで頑張ってたもんな~
DMM通販の抽選とキャンセル待ちに賭けましょう分は悪くないはずだ
7144民向け