Show newer

休みますメールを出そうとPC開いたら元気が出てきたので午後から出社しますって言ってしまった
出かけないと……

寝坊したのでそのまま寝てたけど午後から出社するか一日休むかまだ悩んでる

NASのHDD交換してからアクセス音がでかくなった気がしてたけどここ数日は夜中にゴリゴリ言いまくっててやけに気になる
コンプレッサー用の振動吸収マット敷いて様子見よう

体調も全然回復しないし明日また仕事なのいやだな
木曜金曜休みて~

疲れたのか少し頭痛くなったので日記でも書いて寝ますか
日記書くのに1時間くらいかかりそう

まあCPU実行で全然CPU食わないからDirectMLにする意味もないか
VRAM食われても逆に困るとかありそう

バイナリビルドされた時にDirectML対応がOFFに設定されてたっぽいね
WindowsならONでよさそうなのに

DirectMLは使えそうなので指定してみたがWindows only言われてしまった
Windows 11はWindowsではない……?

音量のノーマライズしてねえじゃん
単に受け入れられるフォーマットに変換してるだけだった
最初から決まったフォーマットで入力してるから関係ないわね

メモリは500MBとか食うけどCPU自体は全然食わないな
不思議~

バックエンドがONNX RuntimeてことなのでなんかGPU使ってよみたいな指定してら適当に使ってくれるのかと思ったけどそうでもなさそう?
なんかGPUは使えないのでCPUにフォールバックします的なっちゃった
まあCPUでもそんな重そうには見えないのでいいんだが

0.9秒の余白付けて渡したら上手くいった!
あとPythonのだと音量の(?)ノーマライズしてるっぽいけどこれはJavaScriptでちょちょっとやるには重そう

おっとReazonSpeechのPythonのライブラリを見たら頭に0.9秒の余白付け足してから認識させてんじゃん
これか~

発話の認識は上手くいってるっぽいな
音声認識の方がなぜか頭の方無視しがちのようだ
俺のしゃべりが問題な可能性も十分あるけども

ライブラリに渡すパラメータもほんとにこれであってるのかわからんのでソースを見たいんだが、ソースがどこにあるかわからない
GitHubのリポジトリのURLが貼られてるけどほんとにそこにある~?

VADの設定の意味が書いてなくてよくわからん

オーバーフローで終了するのは単に間に合ってないだけだと思われるので頭の方が切れるのだけなんとかしたい

うーん発話の頭の方が無視されちゃうのと長々としゃべるとオーバーフローとかで終了しちゃう問題があるものの、認識自体は精度よさそう

Show older
7144.party

7144民向け