AdaBoost | エイダブースト(アダブースト)は、Yoav FreundとRobert Schapireによって考案された機械学習アルゴリズム。AdaBoost は、それぞれの標本に対し、弱い分類器順に適用し、それぞれの分類器が正解したか否かを判断する。間違って分類された標本に対応する重みより重くされる |
Adam | 勾配降下法の改良アルゴリズム。Adamは過去の勾配のスライディングウィンドウに基づいて学習率をパラメータごとに調整し計算を行うアルゴリズム。画像認識など良く利用されている。 |
AI | 人工知能。推論、認識、判断など、人間と同じ知的な処理能力を持つ機械のこととされる。ただし専門家の間でも明確な定義はされていない。 |
AI効果 | AIで何か新しいことが実現されると、「それは自動化であって知能ではない」と思いたがる人間の心理的効果のこと |
AlexNet | AlexNetは、Hinton教授らのチームによって発表された物体認識のためのモデル。AlexNetが、物体認識のために、初めて深層学習の概念および畳み込みニューラルネットワークの概念を取り入れた。画像分類チャレンジコンテスト(ILSVRC)において、AlexNetが飛躍てきな性能を果たした。 |
AlphaGo | ディープマインド社が開発した囲碁プログラム。2016年にトップレベルのプロ棋士に勝った。 |
AlphaGo Zero | AlphaGo の改良版。2017年に発表された。AlphaGoが過去の棋譜を使って学習したのに対し、AlphaGo Zeroは棋譜を全く使わず自己学習のみでAlphaGoを超える強さを獲得した。 |
Attention | seq2seq の改良のため、2つの時系列データ間の対応関係を学習するAttention層を追加したニューラルネットワーク。 |
Bidirectional RNN | RNNの改良で、LSTMを2つ組み合わせて、過去方向だけでなく未来方向からの情報もフィードバックできるようにしたもの。時間情報の欠損部分を予測することができる。 |
BoW | Bag of Wordsの略。テキストデータを数値化する技法の1つ。ある文書における単語の出現回数を数えるアルゴリズム。単語数を数えることにより、複数の文書を比較したり類似性を測定することができる |
BPTT | BackPropagation Through-Time。RNNにおける誤差逆伝搬が、過去に遡って誤差を反映することになるため、こう呼ばれる。 |
Cycプロジェクト | すべての一般常識をコンピュータに取り込むことを目的としたプロジェクト。開始から30年以上経った今も継続中 |
DCGNN | Deep Convolution GAN。CNNを用いたGANを指す。 |
DENDRAL | 有機化合物を特定するためのエキスパートシステム |
DNN | ディープニューラルネットワークのことを。ニューラルネットワークの層を深くしたモデルのこと言う。 |
DQN | 従来の強化学習の手法であるQ学習にディープラーニングを組み合わせたもの。 |
ElasticNet正則化 | L1正則化とL2正則化の両方をしようした正則化の手法。 |
ELIZA | 高度な技術を使わずに知的な振る舞いをする例として、1966年に開発された。人工無能の例 |
ENIAC | 世界初の汎用コンピュータ。1946年、アメリカのペンシルバニア大学で開発された。 |
fastRCNN | R-CNNにおいて領域切り出しと物体認識を同時に行うことで、処理の高速化を実現したシステム。さらに改良されたfasterRNNも提案されている。 |
GAN | 敵対的生成ネットワークモデルとよばれるアルゴリズム。画像を生成したり、変換したりすることに利用されている。画像を生成するジェネレータと、画像を本物かジェネレータが生成した偽物かを判断するディスクリミネータがお互いを超えるように学習をしていく構成。 |
GooglePhoto | Google社が開発した画像認識システム。アフリカ系の男女をゴリラと判定してしまうことで大きな問題となった。 |
GPU | Graphic Processing Unit。画像処理用に最適化された演算処理装置。同一演算を多数同時並列で行うという特徴がディープラーニングでの処理に適しているため、頻繁に流用される。 |
ILSVRC | ImageNet Large Scale Visual Recognition Challenge。大規模な画像データセットの代名詞でもあるImageNetを使った画像認識コンペティションのこと。2010年から開催されている。2012年にAlexNetがCNNを取り入れ驚異的な性能を示した。 |
ImageNet | 画像認識用の学習・研究用に良質な画像を集めたデータセットの1つ。1400万枚を超える画像がデータセットととして納められている。 |
k-means | 教師なしの機械学習の1つであるクラスタリングの計算を行うアルゴリズム。K平均法とも言う。 |
k-分割交差検証 | 交差検証の一種。訓練データと評価データへの分割を複数回行い、それぞれで学習、検証を行う手法。ホールドアウト検証も参照のこと。 |
L1正則化 | 過学習を防ぐ正則化の手法。特定のデータの重みを0にする事で、不要なデータを削除する手法。LASSO(ラッソ)回帰も参照のこと。 |
L2正則化 | 過学習を防ぐ正則化の手法。データの大きさに応じて0に近づけて、滑らかなモデルとする手法。Ridge(リッジ)回帰も参照のこと。 |
LeNet | 1998年に、Yann LeCunによって考案された初の畳み込みネットワーク。構造としては、畳み込み層とプーリング層のセットを2回繰り返すのが特徴である。近年開発されたものと比較すると、層が浅く単純である。 |
LSTM | 時系列データを扱いディープラーニングの手法の1つ。RNNの欠点を改良したアルゴリズム。長期的な依存関係を学習することが可能 |
Mini-Max法 | ゲーム戦略で、自分の手順は自分が有利に、相手の手順は自分が不利になるよう戦略と立てる手法 |
MNIST | 「0」から「9」までの手書き数字画像60,000枚と、テスト用画像10,000枚を集めたデータセット。Mixed National Institute of Standards and Technology databaseの略。手書きの数字の認識用データセットとしてよく使われる。 |
NTM | ニューラルチューリングマシン(Nueral Turing Machine)。チューリングマシンをニューラルネットワークにより実現する試み。プログラムの入出力からプログラムを生成、すなわちプログラムの自動生成が可能となる。 |
NVIDIA | GPU メーカ。ディープラーニング用のライブラリではNVIDIA製GPUしかサポートしていないものが多い。 |
one-hot-encoding | n種類のカテゴリデータを、n次元ベクトルに変換して表現し、1桁のみ1とし残りの桁を全て0で表現したもの。学習時に正解ラベルをone-hot-encoding形式に加工することが良くある。 |
R-CNN | Regional CNN。画像から物体がある領域を切り出し、切り出した領域ごとにCNNで処理をする手法。 |
ReLU関数 | ランプ関数とも呼ばれる活性化関数の1つ。微分しても0にならず、勾配消失しないため隠れ層(中間層)で良く使用される。派生として Leaky ReLU、Perametrc ReLU、Randomized ReLUなどもある。 |
Ridge(リッジ)回帰 | 線形回帰に対しL2正則化を適用した手法。 |
RNN | Recurrent Neural Network(リカレントニューラルネットワーク)。再帰型ニューラルネットワークと呼ばれる。時系列データ予測の学習するに用いられる。隠れ層の出力の次の入力とすることで時系列に連続したデータの学習が可能となる。長期的な記憶の維持が困難になる欠点があり、LSTMで改良されている。 |
RNN Encoder-Docoder | 2つのLSTMを一つは入力を処理するエンコーダ、もう一つは出力を処理するデコーダとして組み合わせ、出力を時系列化するRNN。 |
RPA | RPA(Robotic Process Automation)。これまで人間が行ってきた作業を高性能な認知技術(ルールエンジン・機械学習・人工知能など)を用いることによって、業務の自動化や効率化を実現すること。 |
skip-gram | word2vecの一手法。ある単語を与えて周囲の単語を予測するモデル。CBOWも参照のこと。 |
SSD | Single Shot Decoder。領域の切り出しと認識を同時の行うことで画像の高速な検出処理を可能とした。 |
STRIPS | Standard Reserch Institute Problem Solver。1971年に開発されたプランニングのための人工知能 |
SuperVision | トロント大学が開発したディープラーニングを用いた画像認識システム。2012年のILSVRCにおいて圧倒的な勝利を収め、ディープラーニングのブームの火付け役となった。 |
SVM | サポートベクトルマシンと呼ばれる機械学習の手法。マージンの最大というコンセプトに基づいて設計されている。カーネトリックと呼ばれる技法を使い非線形問題にも対処できる |
tanh関数 | ハイパボリックタンジェント。双曲線関数の1つ。ディープラーニングの活性化関数の1つ。隠れ層に良く利用される。 |
Tensorflow | Google社が開発した、ディープラーニング用のフレームワーク。最も利用されているフレームワーク。GPU版やブラウザでどうさするJavaScript版などが存在する。 |
TPU | Tensor Processing Unit。Google社製のテンソル計算に最適化された演算処理装置。 |
VAE | 変分オートエンコーダ(Variantional AutoEncoder)。画像分野での生成モデル。オートエンコーダにおいて入力を統計分布に変換しそれを学習の対象とする。 |
VGG16 | ImageNetと呼ばれる大規模画像データセットで学習された16層からなるCNNモデル。Oxford大学の研究グループが提案し2014年のILSVRで好成績を収めました。 |
Watson | ワトソンは、IBMが開発した質問応答・意思決定支援システムのことで「自然言語を理解・学習し人間の意思決定を支援するもの」と定義されている。AWSやGoogleと同じようにクラウド上で画像認識などのサービスが利用できる。 |
word2vec | 単語をベクトル化して表現し、テキスト処理をこなうニューラルネットワークのこと |
Xavierの初期値 | ニューラルネットワークにおいて、パラメータの初期値として与えておく値の例。ReLU関数に対して有効であるとされている。 |
YOLO | You Look Only Onseの略。YOLOはリアルタイムオブジェクト検出アルゴリズム。画像を一度CNNに通すことで、高速オブジェクトを検出することが可能になっている。 |
アファイン変換 | 幾何学の分野で、ある図形を回転させたり引き延ばしたりする変換。 |
アンサンブル学習 | 複数の機械学習アルゴリズムを組み合わせて学習すること。 |
アンダーフィッティング | オーバーフィッティング(過学習)に対し、正則化などの対策をし過ぎて予測性能が低下してしまうこと。 |
イテレーション | ディープラーニングの学習において、重みを更新する回数を表す指標のこと。 |
エキスパートシステム | 第2次AIブームで登場した専門知識を保持させ、質問に答える形式で専門と同等の判断をさせようと開発されたAIシステム。 |
エッジコンピューディング | IoTデバイスの発展により、利用者に近い場所(エッジ側)でデータを処理することを言う。ディープラーニングもデバイスの発展によりエッジ側で処理が出来るようになりつつある。 |
オートエンコーダ | 自己符号化器とも呼ばれる。ニューラルネットワークを使った次元削減の手法。画像のノイズ除去や製品の異常検知などに応用ができる。 |
オンライン学習 | 1つひとつの学習データごとに学習処理を行い、重みを更新する手法。学習データセットのサイズが大きく、それらが互いに独立していない場合、バッチ学習よりもより良い結果が得られる言われている。逐次学習とも言う。 |
カーネル | 畳み込みニューラルネットワーク(CNN)の畳み込み層で使用されるフィルターのことをカーネルとも呼ばれる。 |
回帰問題 | 入力値から出力値(スカラー値)を予測する問題の総称。気温から清涼飲料水の売り上げを予測ような問題。最も基本的な技法に最小二乗法と呼ばれるアルゴリズムがある。(対語:分類問題) |
過学習 | オーバーフィッテイングとも言う。機械学習において、学習モデルが訓練データにフィットしすぎて、訓練データでは良い精度を示すがテストデータでは、それほど精度を示さない状態を言う。 |