[AI] Hey Siri! を誰でもかんたんに15分で技術解説! [初心者]

iPhoneいまさら聞けない、「ヘイシリー」ってどんな技術?ディープラーニング?

この記事でわかること

マット
マット

今回はAIで使われる機械学習のアルゴリズムについて学ぼう。でも安心して、誰にでもシンプル紹介!最新のオンラインコースや書籍、そして世界中から集めた情報を紹介するね!おまけのおもしろSiri問答集やQA・用語集もどうぞ。では 早速行きましょう!

今さら聞けないAIで使われる機械学習アルゴリズムってなに?

iPhone Siriの仕組みをみてみよう!

自分にあった機械学習の学び方

初心者向け Q and AI と用語集

今さら聞けないAIで使われる機械学習アルゴリズムってなに?

マット
マット

機械学習とは、機械学習では、さまざまなアルゴリズムを用いてデータから反復的に「学習」するため、人間が探すべき場所を明示的にプログラムしなくても、コンピューターが自律的にデータから洞察を導き出せるよう学習させることだよ。つまりAIやディープラーニングの一部の機能・作業だよ

AIで特に大切な「学習」と「推論」を説明するね。
学習」とは「情報から将来使えそうな知識を見つけること
推論」とは「知識をもとに,新しい結論を得ること」です.
なのでこれから紹介するWeb APIも「学習」と「推論」の二つがそれぞれの機能で動くよ

iPhone Siriの仕組みをみてみよう!

出典:日本アップル社
マット
マット

そもそもAI人工知能と機械学習で、どこで動くのか?答えはみんなの想像通り、コンピュータだよ。コンピュータとはパソコンや、サーバー(パソコンが更に高性能になったもの)をたくさんネットワークでつないで、協調しながら動いているよ。

ここでは、iPhone の実装例で説明するよ

ハンズフリー 音声入力

「ヘイ! シリー」機能は、まずハンズフリーでユーザーが音声呼び出し。iPhone又はAppleWatchのマイクは、1秒当たり160,000回の速度であなたの声を、音声信号波形にかえてフレーム/0.0.1秒の音声デジタルデータに変換するよ

出典:アップル社研究資料
音声デジタルデータをSiriサーバー(音声認識、ディープラーニング、サービス)に送信
Siri サービスに音声デジタルデータを送信
音声信号波形フレームをDNN(ディープニューラルネットワーク)処理

サーバーで受信した音声入力(Acoustic Input)データを、DNN処理したのち、HMMスコアで推論するよ。
出典:アップル社研究資料
DNNから出力された点数の高いテキストをブラウザへ

ようやくみなさんのiPhoneに点数(類似度)が高いテキストが、HTTPで返却される。
単純に「ヘイ シリー!」であれば、マイクが有効になって録音が始まるね。
「ヘイ シリー!近くのピザ屋さんは?」であれば、携帯電話のブラウザからGoogleなどに検索キーワードが送信されるよ。

機械学習のアルゴリズムをみてみよう!

機械学習のアルゴリズムとは?

機械学習の優位性は、大量のデータを処理でき、逐次処理でき、人間のスキルによらず高精度に処理でき、モデルを繰り返し利用できる、といったメリットだね。人間には限られた少ないデータから推論するのは得意だけど、膨大なつまり十分なデータ(100枚の画像など)があれば、機械学習は人と同等以上の精度で判断できるよ。
代表的な機械学習は、未知の入力に対して出力を予測する「教師あり学習」とデータ自体の性質を抽出する「教師なし学習」とに分けることができるよ。教師あり学習には、ラベルを予測する「分類」と数値を予測する「回帰」があるね。分類は、たとえば人や猫の画像をラベル分けする目的だね。回帰は、たとえば機械の故障などを、金属の経時疲労を予測し、装置の故障タイミングを予知することなど使われるよ。

代表的な分類アルゴリズムと回帰アルゴリズム

代表的な分類、回帰アルゴリズムのモデルを集めたよ。ポイントは各モデルで必要なデータ量が違っていたりすることろ。だから、モデルの精度を上げる必要がある。通常はデータ量が多いほどモデルの精度が高くなるけど、適切なモデルを作成するには統計の知識が必要だね。

 回帰分類説明
線形回帰 説明変数の係数と切片から連続値を予測する
ロジスティック回帰 線形回帰の出力をロジット関数に入力することで分類結果を予測する
自己回帰移動平均モデル 過去の値からの自己回帰や他の共通要素の移動平均を使って予測対象の時系列データを実績値のみから予測する
状態空間モデル 状態モデルと観測モデルを定義して、予測対象の時系列データをそれ以外の説明変数の時系列データから予測する
k 近傍法 未知データに対して、k個の学習データから最も近いものを選ぶ
サポートベクターマシン各学習データ点からの距離(マージン)が最大となるような識別境界のパラメータを学習する
決定木データと閾値を比較して段階的に分割するルールを木構造でモデル化する
ランダムフォレスト互いに独立決定木を大量に生成し、各々が異なる特性を持つように学習させ、各決定木の結果を集計して予測する
勾配ブースティング生成済みの決定木が間違えてしまうデータを優先的に正しく予測できるように決定木を逐次的に増やす
ニューラルネットワーク複数のニューロンをつなげてネットワークを構成し、出力層での誤差が小さくなるように各ニューロン間の結合の重みを更新する
代表的な分類と回帰アルゴリズム

次の図は、実際の企業が研究している製造装置におけるプロセス条件とモデルを用いた、機械学習の実験フローの事例だよ。

出典:東京エレクトロン

自分にあった機械学習の学び方

AIの入門コースと書籍一覧

初心者には、独学で難しい機械学習本を1ページ目から読み始めるのはおすすめしないよ!マットがおすすめするのは、オンラインで効率よくビデオや凝縮されたテキストでコースをざっと理解する事。ひとはだれでも、一緒に学ぶと理解が進みモチベーションが保ちやすよね。こちらのコースを学んだあとに、おすすめ書籍を参考書として使ってね!
マットのおすすめのオンラインコースは、Udemyなどのオンラインスクールがおすすめ。もちろん一人で、Python入門から始まり、統計数学・シグモイド関数、ニューラルネットワークを進めてよいけど、結構大変。
今なら¥15,000円から¥24,000くらい厄13~28時間ビデオ、たくさんの記事、サンプルソース、期間制限なしで学べるよ。

まずおすすめその1は、次の順番だよ。まずはマストアイテム”Python“ヘビ!だね。このスクリプト言語は非常にシンプルで、C++やJavaと比較してもプログラミング行数が圧倒的に少なく、簡潔にかけるよ。

次におすすめその2は、Pythonを使った機械学習の入門編だね。

最後のおすすめはその3は、

おすすめ その1 -Python3 入門+応用-

応用では、データ解析データーベースネットワーク、暗号化、並列化、テスト、インフラ自動化、キューイングシステム、非同期処理など盛り沢山の内容です!
14577件のいいね評価で、¥24,000円で28.5時間ビデオ、10つの記事、期間制限なしで学べるよ。

学習内容

  • Python3の基本の習得できます。
  • 応用編の講義もありますので、簡単なアプリケーション開発に必要なスキルを習得できます。
  • Pythonicなコードのスタイルを身に付けることができます。

このコースでは、Python3の基礎である入門コースを一通り終えた後に、今後のアプリケーション開発に役立つためのPythonのテクニックやデーターベースアクセス(SQLite, MySQL, MongoDB, SQLAlchemy, memcached, Hbase, neo4j etc)、WEB(Flask, socket, RPC etc)、インフラ自動化(Fabric, Ansible)、並列化(スレッド、マルチプロセス)、テスト(Unittest, pytest, Tox, Selenium, etc)、暗号化(pycrypto, hashlib)、グラフィック(turtle, Tkinter)、データ解析(numpy, pandas, matplotlib, scikit-learn), キューイングシステム(ZeroMQ, Celery)、非同期処理(asyncio)などのPythonを使った応用編を取り入れているよ!

おすすめ その2 -ゼロからのPythonで学ぶ人工知能と機械学習-

このおすすめでは、Udemyなどのオンラインスクールの、Pythonで学ぶ人工知能と機械学習が推し! ひとりで統計数学・シグモイド関数、ニューラルネットワークを進めてよいけど、結構大変。そんな君には、今なら¥15,000円で13時間ビデオ、7つの記事、6個のサンプルソース、期間制限なしで学べるこのコースがおすすめ!

学習内容
このコースで学べるのは、

  • 簡単な機械学習のコードを書けるようになります。
  • Pythonの基礎的なプログラミング技術が身につきます。
  • ビジネス上必要な人工知能の基礎知識が身につきます。
  • 有名な機械学習ライブラリが扱えるようになります。
  • 機械学習と関連した簡単な数学の知識が身につきます。
  • 人工知能全般についての知識が身につきます。

おすすめ その3 -ゼロからのおさらい 統計基礎-

このおすすめは、Udemyなどのオンラインスクールがおすすめ。もちろん一人で、Python入門から始まり、統計数学・シグモイド関数、ニューラルネットワークを進めてよいけど、結構大変。
今なら¥10,200円で2.5時間ビデオ、1つのダウンロード可能なリソース、期間制限なしで学べるよ。

学習内容
初心者向けで機械学習に必須の統計を一気に復習するコースです。プログラミング言語Python以外にも、機械学習で頻出するキーワードが統計です。プログラミングの基礎以外にも必要な数学を勉強しましょう!
 (3.5)

学習内容
このコースで学べるのは、何となく分析をしているけれど、これで本当に合っているのだろうか…?

部下の持ってきたデータをそのまま信じていいものか。経営判断がしづらい…。

そんな悩みを持つかたにぜひおすすめしたい、統計学の入門講座です。

数学が苦手でも大丈夫。統計学の基礎をゼロから身につけていきます。

エクセルを使った練習問題で、明日から使える分析手法を身につけましょう。

  • 統計学の考え方をもとに正しいアプローチでデータを分析し、意思決定に寄与できるようになります。

おまけ

機械学習を学ぶには、Google Colaboratoryに代表される開発ツール以外にも、さまざまな環境、言語(python,C++,Java)になれたほうがよいよ。下の図はAIで使われている言語、データベース、ツールなどだよ。

おすすめ3選を紹介Fire HDならオンラインスクールの受講も、カフェ、ベッド、公園、そして通勤中でも自由!もちろん音楽を聴いたり、ネットフリックスやブラウザで調べものOK!

  • 【8インチから10.1インチの大画面】1080pフルHD、224ppi解像度の鮮やかなディスプレイ
  • 【最大12時間の長稼働バッテリー】USB-C(2.0)接続で充電も簡単
  • 【3から4GB RAM】オクタコアプロセッサ搭載
  • ワイヤレス充電】ワイヤレス充電スタンド(別売)を使えば、タブレットをShowモードで充電しながらAlexaを使ってハンズフリーでタブレットを使用することができます。
  • 2画面表示機能】ショッピングをしながらメール確認などの二つのアプリが同時操作可能
  • HDビデオ通話】AlexaアプリやZoomアプリをお持ちの友人や家族と高画質でビデオ通話が可能
  • Alexa搭載】Alexaに話しかけるだけで動画、音楽、Alexa対応家電など簡単操作
  • エンターテイメント】NetflixやDAZNなどの人気のアプリに加えて、映画やドラマ、音楽や電子書籍まで数千万を超える様々なコンテンツもこの一台で
[PR]年収UP率93.8% / 平均年収UP額126万円のエンジニア転職サイト【転職ドラフト】

初心者向け Q and AI

AI(人口知能)とは?
知的な機械(特に,知的なコンピュータプログラム)を作る科学と技術の総称だよ.
つまり一般的な人の知能を理解するためにコンピュータを使うことと関係があるけど,自然界での生物(人と動物)が行っている知的手段だけの研究と限定していないよ.
知能とは?
知能とは,実際の目標を達成する能力のコンピュータであれば計算的(CPU)、人であれば脳の部分だね.人間,動物,そして機械(CPU)には,種類や水準がさまざまな知能があるね.
AIは、人の知能をまねようとしているの?
ときにはそうしますが,いつもというわけではありません.あるときは,機械に問題を解決させることについて,他人や自分自身がどうするかを調べます.一方,AIのほとんどの研究は,人間や動物について研究するよりも,知的に解決しなければならない問題そのものについて研究しています.AI研究者は,人間やらないような方法や,人間ができるよりも多くの計算を伴う方法を用いることもできるね。
コンピュータプログラムには、知能指数(IQ)があるの?
いいえ。知能指数は子供の知能の発育の度合いを基にしているよ.その子供の年齢に対する,子供がふつうにその子供の得点をとる年齢に対する比率を示すよ.この比率及びIQテストを成人にも適用したのがIQ(知能指数)だね。しかし,AIコンピュータにとって、長い数字列を扱うのはたやすいことだね.なので,IQテストのいくつかはAIの研究目標として役立つね.
AIは,人間の心をコンピュータに宿らせる?
結論はでていないよ。それが目的であるという研究者もいるけど,それは例えとしての(比喩的な)意味です.人間の心には多くの特色や違いがあり,それらの全てを本気でまねようとする研究者がいるとは思えません.(2021年現在は)
AIは、人間並みの知能を目標としているの?
はい.最終的な目標は,人間と同じ程度に,世の中の目標を達成し,問題を解決できるコンピュータプログラムを作ることです.ですが,専門的な分野の研究をしている多くの人はこのような考えを持っていないよ。
AIは、人の仕事をとっちゃうの?
定型的な労働・作業は、人工知能の方が、より正確に、かつ、安価にこなすようになるね。そのような事務仕事、レジ業務、データ入力、翻訳、窓口業務はAIに代わるといわれているよ。

[おまけ] Siri 面白回答集

おーけー グーグル
「Siri」おもしろい冗談ですね.. 愉快という意味ではなく興味深いという意味ですよ。(嫌味)
付き合って
そうしたいところですが、私には実体がないのでできません。
おみくじ
えっと … ラッキーアイテムは、iPhoneだと書いてあります。
サンタさんはいますか
もちろんです。そんなことを聞くなんて驚きました。

初心者向け 用語集

AI用語集 – 初心者の方向け

ニュースでよく聞く、難しい言葉やAI用語を整理するよ。

人工知能(AI)
一般的に、AIとは、人間のように働き、反応する知的な機械を作ることに重点を置いたコンピュータサイエンスの分野です。AIを、人間が行う際に知能を必要とすることを可能にする機械を構築することを目的とした、コンピュータサイエンスの多くの技術要素をまとめた幅広い用語。これらの分野には、次に説明する機械学習深層学習コンピュータ・ビジョン自然言語・音声処理コグニティブ・コンピューティングロボティック・プロセス・オートメーション(RPA)などがあります。

機械学習
機械学習とは、コンピュータシステムが、プログラムされた特定の指示に従わなくても、データに触れることでパフォーマンスを向上させる能力のこと。言い換えれば、機械学習とは、大量のデータの中から自動的にパターンを見つけ出し、それをもとに予測やより良い情報に基づいた意思決定を行うプロセスのことだよ。

ディープラーニング(深層学習)
ディープラーニングは比較的新しい強力な技術で、ある層からの出力が次の層の入力となるようなディープニューラルネットワークで情報を処理するアルゴリズム群を含むよ。”深層学習アルゴリズムは、がん細胞の検出や病気の予測などで大きな成果を上げているよ。

コンピュータビジョン
画像を扱いやすいように分析し、画像内の物体のエッジやテクスチャーを検出し、他の既知の物体と比較して分類する技術を用いて、写真内の物体、シーン、活動を識別するコンピュータが持つ能力のこと。基本的には、コンピュータビジョンは、画像や多次元データから情報を得る人工的なシステムを構築するための理論と技術だね。
自然言語/音声処理。人間と同じようにテキストや言語を扱うことができる能力のこと。
事例:テスラモーターズの自動運転。ナンバー読み込み。アマゾンの無人倉庫向け運搬ロボット。アップル社のSiri。

コグニティブ・コンピューティング
IBM社が提唱するコグニティブ・コンピューティングは、認知科学の知識を応用して、機械学習、自然言語処理、視覚、人間とコンピューターのインタラクションなど、複数のAI手法をまとめてアーキテクチャを構築し、人間の思考プロセスをシミュレートすることで、複雑な状況下でより良い意思決定を行うことを目的としています。コグニティブ・コンピューティングの目的は、人間に代わって意思決定を行うのではなく、人間がより良い意思決定を行えるように作られているよ。

事例:IBMワトソン(コンピュータ)を活用した例。自動受け答え機能。知識検索など。


IBM出典:IBM

ロボティック・プロセス・オートメーション(RPA)
RPAは、ビジネスオートメーションにおける有望な新展開であり、2018年に非常に人気が高またね。IBMはこれを、プロセスやビジネス上の意思決定の自動化、データ取得の取り組みなど、より広範な自動化の取り組みと容易に統合し、自動化プログラムの価値を拡大できるソフトウェアと定義しているよ。
RPAは、トランザクションの処理、データの操作、応答のトリガー、他のデジタルシステムとの通信など、既存のビジネス・プロセス・マネジメント(BPM)アプリケーションを自動的に取り込み、解釈するように構成されているよ。エンタープライズ・オートメーション・ツール(BPMなど)との主な違いは、RPAが人間のオペレーターではなく、ソフトウェアや認知ロボットを使ってプロセス操作を行い、最適化するよ。
RPAとAIの違いを一言で表すと、「自己学習能力」の有無だね。AIには自己学習機能があるけど、RPAはあくまで指示通り(プログラム)に忠実に動くよ。
事例:三菱UFJによる、事務処理自動化(200業務)で9500人分削減。

AI用語集 -ディープラーニングの4つの手法-

DNNは、ディープラーニングでよく用いられる4つの手法のひとつだよ。

人工知能(AI)
一般的に、AIとは、人間のように働き、反応する知的な機械を作ることに重点を置いたコンピュータサイエンスの分野です。AIを、人間が行う際に知能を必要とすることを可能にする機械を構築することを目的とした、コンピュータサイエンスの多くの技術要素をまとめた幅広い用語。これらの分野には、次に説明する機械学習深層学習コンピュータ・ビジョン自然言語・音声処理コグニティブ・コンピューティングロボティック・プロセス・オートメーション(RPA)などがあります。

機械学習
機械学習とは、コンピュータシステムが、プログラムされた特定の指示に従わなくても、データに触れることでパフォーマンスを向上させる能力のこと。言い換えれば、機械学習とは、大量のデータの中から自動的にパターンを見つけ出し、それをもとに予測やより良い情報に基づいた意思決定を行うプロセスのことだよ。

ディープラーニング(深層学習)
ディープラーニングは比較的新しい強力な技術で、ある層からの出力が次の層の入力となるようなディープニューラルネットワークで情報を処理するアルゴリズム群を含むよ。”深層学習アルゴリズムは、がん細胞の検出や病気の予測などで大きな成果を上げているよ。

コンピュータビジョン
画像を扱いやすいように分析し、画像内の物体のエッジやテクスチャーを検出し、他の既知の物体と比較して分類する技術を用いて、写真内の物体、シーン、活動を識別するコンピュータが持つ能力のこと。基本的には、コンピュータビジョンは、画像や多次元データから情報を得る人工的なシステムを構築するための理論と技術だね。
自然言語/音声処理。人間と同じようにテキストや言語を扱うことができる能力のこと。
事例:テスラモーターズの自動運転。ナンバー読み込み。アマゾンの無人倉庫向け運搬ロボット。アップル社のSiri。

コグニティブ・コンピューティング
IBM社が提唱するコグニティブ・コンピューティングは、認知科学の知識を応用して、機械学習、自然言語処理、視覚、人間とコンピューターのインタラクションなど、複数のAI手法をまとめてアーキテクチャを構築し、人間の思考プロセスをシミュレートすることで、複雑な状況下でより良い意思決定を行うことを目的としています。コグニティブ・コンピューティングの目的は、人間に代わって意思決定を行うのではなく、人間がより良い意思決定を行えるように作られているよ。

事例:IBMワトソン(コンピュータ)を活用した例。自動受け答え機能。知識検索など。


IBM出典:IBM

ロボティック・プロセス・オートメーション(RPA)
RPAは、ビジネスオートメーションにおける有望な新展開であり、2018年に非常に人気が高またね。IBMはこれを、プロセスやビジネス上の意思決定の自動化、データ取得の取り組みなど、より広範な自動化の取り組みと容易に統合し、自動化プログラムの価値を拡大できるソフトウェアと定義しているよ。
RPAは、トランザクションの処理、データの操作、応答のトリガー、他のデジタルシステムとの通信など、既存のビジネス・プロセス・マネジメント(BPM)アプリケーションを自動的に取り込み、解釈するように構成されているよ。エンタープライズ・オートメーション・ツール(BPMなど)との主な違いは、RPAが人間のオペレーターではなく、ソフトウェアや認知ロボットを使ってプロセス操作を行い、最適化するよ。
RPAとAIの違いを一言で表すと、「自己学習能力」の有無だね。AIには自己学習機能があるけど、RPAはあくまで指示通り(プログラム)に忠実に動くよ。
事例:三菱UFJによる、事務処理自動化(200業務)で9500人分削減。