にほんブログ村 アニメブログへ

 

無料アプリ「フォートトーク」体験、世界初の音声認識技術!

経済・世界のニュース
この記事は、Cognitive Research Labs,Inc.のアプリ「フォートトーク」をご紹介するものです。以下文章は、カーネギーメロン大学博士である苫米地英人さんのTwitterより抜粋いたしました。

↓Cognitive Research Labs,Inc.のHP

Cognitive Research Labs,Inc. Official Web Site

↓苫米地英人さんのブログ

ドクター苫米地ブログ − Dr. Hideto Tomabechi Official Weblog - ライブドアブログ
ドクター苫米地ブログ − Dr. Hideto Tomabechi Official Weblogです。Powered by ライブドアブログ。
1987年に第1回MT Summit(機械翻訳サミット)がカーネギーメロンで私が大学院生で所属していたCenter for MachinenTranslation主催で開催されました。

↓カーネギーメロン大学HP

Homepage - CMU - Carnegie Mellon University
CMU is a global research university known for its world-class, interdisciplinary programs: arts, business, computing, engineering, humanities, policy and scienc...
そこで世界最初の音声通訳システムが発表、デモされ、CNNでも報道されました。

全体設計とプログラミングの担当は私でした。医者と患者の英日通訳でした。

というか研究所副所長であり指導教授でもある冨田勝准教授から、設立間もない研究所の世界デビューに「インパクトのあるデモをやれ」との指示で夏休み返上で、当時出来ていた単語音声認識システムを不特定話者連続音声認識に改造したり、冨田パーサに意味理解組み合わせたりで、パッチワークで作り上げました。
音声合成は規則合成のDECTalk(MITTalk)を使いたいと思い、当時大変高価で数も少なく、Tommy(冨田准教授はそう呼ばれてました)に相談したら、どう調達したのか次の日に私の机の上にドーンと置かれており、Yaleから移りたての私は「CMUは凄い」と変な感動してました。DEC Talkはスーツケースサイズで巨大でした。

↓DECtalkについて

DECtalk DTC-01 : Digital Equipment Corporation : Free Download, Borrow, and Streaming : Internet Archive
DECtalk was a speech synthesizer and text-to-speech technology developed by Digital Equipment Corporation in 1984, based largely on the work of Dennis Klatt at....
音声認識ハードを組み込み、形態素解析、パーサ、意味処理、知識フレームシステム等を乗せた冷蔵庫サイズワークステーションラック1台をネットワークで、自然言語生成とDecTalkを繋いだ別のワークスステーションに繋ぐ2台構成で、ソフトは全て私がプログラミングして繋ぎました。(徹夜作業で夏休み返上)
姉妹研究所で私も在籍してたロボット研究所で世界初の自律運転車両ALVINNの1989年の世界デビューに先駆けて、世界最初の音声通訳、自動翻訳システムをCMUが発表し、全米報道され、人工知能、コンピュータサイエンス全米ナンバー1の実力を見せつけたのが第1回MTサミットでした。(構築したのは一人の院生)

↓自律運転車両ALVINNについて

Navlab on KDKA

要素技術は研究所成果だけども、元々単語認識ハードとして作られたものを機械語制御コードレベルで音素単位でプログラミングし直し、不特定話者連続音声認識に作り変えたりとか、それだけで博士論文レベルの研究成果でパーサとかもプログラミングで授業料免除にしてもらってたので、中身作ってたから出来た。

だから世界最初の音声通訳システムを"作った"人は間違いなく私。今は普通に売ってる音声通訳システムの世界最初は1987年MT Summitに「インパクトのあるもの」と言われて、みんなびっくりさせようと思って作ったもの。実際出来るまではTommyにも見せないで一人でこもって作ったのが世界初の音声通訳システム。
MT Summittでは、MITとか一応向こうがライバルと思ってるらしい大学は「先にやられた」と悔しがってた。

これから「機械翻訳やろうね」という会議で「出来ちゃった」とデモまでしたので。

日本のATRも音声機械翻訳の7年国家プロジェクトを開始した段階で「もう出来たは困る」と怒られた。そういう経緯で90年にATR(自動翻訳電話研究所)に行った。

↓ATRのあゆみ

ATR|株式会社 国際電気通信基礎技術研究所
情報通信分野における基礎的、独創的研究の推進をおこないます。
うちが音声通訳システムでも独走してることは理解してもらえたかな?

その現代版デモが無償のフォートトークに入れてある。「その他」> 「通訳チャットボット」でマイクボタン押して音声認識開始、もう一度押して認識終了。

各言語翻訳文章をタップで音声化。精度を確認して!
Cognitive Research Labs,Inc. Official Web Site

↑無料アプリ「フォートトーク」は上記リンクよりiOS版をインストールすることができます。

Android版については、「エンジニアに指示しときました。私の仕様のセキュリティとか、いくつかの課題解決したら出ます。」との事です。乞うご期待!

コメント

タイトルとURLをコピーしました