人工知能を使ってみる～Google API & docomo雑談会話 & Open JTalk～よん

さんのつぎのよん（いちお最後ということにする）

さてここからは

『音声認識』『雑談会話』『音声合成』

をしてみます ^^#

最初に言っておきます．いちで紹介した本をもとに
動かなかったとこメモ的にブログに残しているので
ここからは特に大まかなことしかかけません (><)

” 音声認識 ”

今回は Google の Speech API を使います．

その前に何かとよく聞く

『SaaS』『PaaS』『IaaS』ってのを自分メモで残しとくです ^^#

Software as a Service の略でサース．
必要な機能を必要な分だけサービスとして利用できるようにしたソフトウェア，
もしくはその提供形態のこと．一般的にはインターネット経由で必要な機能を利用する仕組み（Wikipedia より）．
” データをインターネットに保存できる！”
” パソコン，スマホ，タブレットなど端末を選ばずデータにアクセスできる！”
” 風数の人が同一データを共有して，さらに編集もできちゃう！”
Google Apps や Salseforce はこのサービスに属する．

■ PaaS

Platform as a Service の略でパースとかパーズ．
ソフトウェアを構築および稼働させるための土台となるプラットフォームを，
インターネット経由のサービスとして提供する．
開発者は，プラットフォーム上で構築したサービスを自分の顧客に提供
することができる．具体的には，インフラ，DBMS，ユーザインタフェース
などのシステム開発手段となるツールや，開発したシステムを運用するための
環境をインターネットを通じて「サービス」として提供し，
月額使用料などの形で収入をえる事業モデル（Wikipedia より）．
Google App Engine や Microsoft Azure はこのサービスに属する．

■ IaaS

Infrastructure as a Service の略で呼び名はまだない．
どうもどう呼ぶかは定まってないようだ．そこでイアースにした ^^#
IaaS は，インターネットを利用したコンピュータの利用形態．
IaaS では，コンピュータシステムを構築および稼働させるための
基盤（仮想マシンやネットワークなどのインフラ）そのものを，
インターネット経由のサービスとして提供する．
IaaS はクラウドコンピューティングサービスの1種類（または1要素）
として SaaS や PaaS に並ぶものとされ，PaaS の発展系ともされる．
IaaS は当初は HaaS（Hardware as a Service）とも呼ばれていた．
ただし HaaS は単なるハードウェアリソース（ハードディスクなど）の，
インターネット経由のサービスとしての提供とされる場合もある
（Wikipedia より）．
Google Compute Engine や Amazon Elastic Compute Cloud（EC2）が
このサービスに属する．

じゃここから本題にもどろっと

1. google chrome dev group に加入し Google API キーを取得しよう(^^♪

Google Speech API を使うには Google API キーが必要で，
それを取得するためには，” google chrome dev group ” への加入が必要です．

これに関しては多くの方がネットで紹介もしてるから
それを参考にしちゃおう♪
本にも手順は丁寧に書かれてます ^^

Google Speech API の処理結果は JSON データフォーマット形式
で返されるんですね．
最初は『ん？』と思ったけど，比較的わかりやすい構造だ．

2. 音声ファイル（.flac）をクラウドにあげ，
音声としてどう認識されたか確認する(^^♪

ここでは本のサンプルをそのまま使ってみるです．
音声ファイル（hello.flac）はとっても高音なロボットな感じの音声で，
『こんにちは』って言っています．
そのサンプルを実行すると...

f:id:MihoN:20170316212831p:plain

ぜんぜん『こんにちは』ちゃうよん...
なんど試してもダメ...

そこで考えたw

A. 自分の声でこんにちはの音声ファイルを作ってそれで実行しよう！
B. その辺にある .wav ファイル食わせられるかな．

よし A. でやってみよう！
そこで，こないだの ” あっちむいてほいっ♪ ” で使った
Audacity を使えば flac 音声を作れそうなのでそれを使って自分の声を
録音しよう！
としたら思い出した．この本のなかで，音声入力の実行のとき，
RasPi のマイクに向かってしゃべって録音する（.flac）
Python プログラムがあったぞと．
ということで，その Python プログラムを実行して，
自分の声のこんにちはを flac ファイルで用意した．
そしてプログラム内のファイル指定箇所を変更．んで，実行．

f:id:MihoN:20170316213853p:plain

わぁーい (⋈◍＞◡＜◍)。✧♡ こんどはちゃんと『こんにちは』になったよ！

ということで，本で用意されている『こんにちは』の .flac ではうまく動かないのは
なんでかよくわからんけど，Google Speech API がうまく認識してくれないみたいw

まあ，みほの声のほうが美しかったんだ ^^# そう思うことにした ♬

で，” B. の .wav ファイル食うかな ” は，やってないのでわからない(笑)

まぁ，言えることは，本もそうだけど，人の作ったプログラムなんかで
動かなくても，置き換えれるファイルがあったら置き換えてみたり，
ファイル名を変えてみたり，短くしてみたり，環境が違うと動かないことも
あるのでなんかやってみたら動くこともあるよん ^^*

” 雑談会話 ”

つぎは，こっちが何か話しかけたら，それにほぼほぼイケてる内容で
返事を返してくれる状況を作ってみよう♬

ここでは docomo 雑談会話 API を使います．

1. docomo Developer support サイトで新規登録してログインしよう

2. API 利用申請をして docomo API キーを取得します

詳しくは，ネットで紹介されているサイトや本を参考にしよう！

さてさて，本のサンプルは『こんにちは』と話しかけてる．
雑談 API からの返事は？ ^^# わくわく

こんにちは！

f:id:MihoN:20170316233900p:plain

は，” はろー ” って返ってきた...
んじゃもう一回w

f:id:MihoN:20170316233949p:plain

” こんにちはです ” ？？あなたはどこの方ですか？(笑)
愛嬌があっておもしろい(笑)

” 音声合成 ”

Open JTalk を日本語音声合成に使おう！

1. Open JTalk のインストールをやりましょう♬

sudo apt-get install open-jtalk

2. 辞書ファイルをインストールしよう(^^♪

sudo apt-get install open-jtalk-mecab-naist-jdic hts-voice-nitech-jp-atr503-m001

音声入力単発テストは ” に ” でやった．
音声がテキストになり，そのテキストに対し対話するひとつひとつは
テストは，ここ ” さん ” でできた．
いよいよ合体させて流しましょう♬

” 音声認識 ” ” 雑談会話 ” ” 音声合成 ” をくみあわせましょう♬

本のサンプルを流します．
お腹が空いていたので『お腹すいた』と話しかけてみた．

こんな感じ(笑) 結果そのいち

f:id:MihoN:20170318114952p:plain

『お腹すくのね？』と聞かれました(笑)
（お腹はすくんですよ...お腹がすくのは元気な証拠なのよ ^^;
そういうあなたもお腹すいてるのね(笑)）

なんかほのぼのします(笑)

何食べようか悩んでいたので『何食べよう』と話しかけてみた．

結果そのに

f:id:MihoN:20170318115316p:plain

急になにか思い出されたようです(笑)
そうなんだ！それは知らなかったよ！教えてくれてありがとう 💛

突然話が方向転換するのは，わたしに似ているかもしれません(笑)
わたしにはわたしに似たロボットがつくのでしょうか(笑)

わたしはできた人なので，相手に合わせることにした．
『（池は防災もかねてるんだ！）安心だね！』と話しかけてみた．

結果そのさん

f:id:MihoN:20170318115549p:plain

『安心は早い』とのことです．
そうだね！安心できることはいいよね．
どんなことも，なかなか安心できないより，早く安心できるのはうれしいね ^^#
見えない相手はきっとこういうことが言いたかったんだとおもうんです(笑)

相手の言いたかったことはこうだろうと，相手を思いやる気持ちが芽生えました ^^#

--- お腹すいたのでパンをたべるお腹5分目 ---

みほは軽くたべた（まだ足りないけど(笑)）ので，
見えない相手ともう一度話してみた ^^

みほ：『おなかすいた！』

再び会話いち

f:id:MihoN:20170318120846p:plain

あいて：『みーとぅー』

きみはハーフ？？わたし英語を勉強しなきゃだからあなたに会えてうれしいよ！

意外な対応がちょっとおどろき＆面白かったので(笑)
『おもしろいね ^^』と返してみた．

再び会話に

f:id:MihoN:20170318121049p:plain

『 w... 』

たまらんち(笑)

ということで，一通り ” 会話しあう ” を体験するのにはわかりやすくいい本だと思う ^^

次は Arduino Uno をつかって，てづくりの会話ロボを作ろう！です．
これはまだやってないし，内容によっては blog にはしないかもです．

昔やった Azure つかった，お天気つぶやきからの～お留守番ロボを
もう一度やってみて blog に残しておきたいし...

いったんここで一本締めということにしときましょ．
読んでくれてありがとうございました (⋈◍＞◡＜◍)。✧♡

Miho's Memory

組込みとアートとまぜまぜ

人工知能を使ってみる～Google API & docomo雑談会話 & Open JTalk～よん

さんのつぎのよん（いちお最後ということにする）

『音声認識』『雑談会話』『音声合成』

” 音声認識 ”

■ SaaS

■ PaaS

■ IaaS

じゃここから本題にもどろっと

” 雑談会話 ”

” 音声合成 ”

” 音声認識 ” ” 雑談会話 ” ” 音声合成 ” をくみあわせましょう♬

『 w... 』

さん のつぎの よん（いちお 最後ということにする）

『音声認識』『雑談会話』『音声合成』

” 音声認識 ”

■ SaaS

■ PaaS

■ IaaS

じゃここから本題にもどろっと

” 雑談会話 ”

” 音声合成 ”

” 音声認識 ” ” 雑談会話 ” ” 音声合成 ” をくみあわせましょう♬

『 w... 』

さんのつぎのよん（いちお最後ということにする）