休みますメールを出そうとPC開いたら元気が出てきたので午後から出社しますって言ってしまった出かけないと……
寝坊したのでそのまま寝てたけど午後から出社するか一日休むかまだ悩んでる
もう1時じゃん寝る
NASのHDD交換してからアクセス音がでかくなった気がしてたけどここ数日は夜中にゴリゴリ言いまくっててやけに気になるコンプレッサー用の振動吸収マット敷いて様子見よう
日記書くのに1.5時間かかった
体調も全然回復しないし明日また仕事なのいやだな木曜金曜休みて~
疲れたのか少し頭痛くなったので日記でも書いて寝ますか日記書くのに1時間くらいかかりそう
まあCPU実行で全然CPU食わないからDirectMLにする意味もないかVRAM食われても逆に困るとかありそう
バイナリビルドされた時にDirectML対応がOFFに設定されてたっぽいねWindowsならONでよさそうなのに
DirectMLは使えそうなので指定してみたがWindows only言われてしまったWindows 11はWindowsではない……?
音量のノーマライズしてねえじゃん単に受け入れられるフォーマットに変換してるだけだった最初から決まったフォーマットで入力してるから関係ないわね
メモリは500MBとか食うけどCPU自体は全然食わないな不思議~
バックエンドがONNX RuntimeてことなのでなんかGPU使ってよみたいな指定してら適当に使ってくれるのかと思ったけどそうでもなさそう?なんかGPUは使えないのでCPUにフォールバックします的なっちゃったまあCPUでもそんな重そうには見えないのでいいんだが
0.9秒の余白付けて渡したら上手くいった!あとPythonのだと音量の(?)ノーマライズしてるっぽいけどこれはJavaScriptでちょちょっとやるには重そう
おっとReazonSpeechのPythonのライブラリを見たら頭に0.9秒の余白付け足してから認識させてんじゃんこれか~
発話の認識は上手くいってるっぽいな音声認識の方がなぜか頭の方無視しがちのようだ俺のしゃべりが問題な可能性も十分あるけども
ライブラリに渡すパラメータもほんとにこれであってるのかわからんのでソースを見たいんだが、ソースがどこにあるかわからないGitHubのリポジトリのURLが貼られてるけどほんとにそこにある~?
VADの設定の意味が書いてなくてよくわからん
オーバーフローで終了するのは単に間に合ってないだけだと思われるので頭の方が切れるのだけなんとかしたい
うーん発話の頭の方が無視されちゃうのと長々としゃべるとオーバーフローとかで終了しちゃう問題があるものの、認識自体は精度よさそう
7144民向け