US2021383924
[0161] Further, there are training methods for neural networks, as well as support vector machines, that enable them to be incrementally trained as more data becomes available.
【0146】
さらに、ニューラルネットワークならびにサポートベクトルマシンには、それらを追加的にトレーニングすることを可能にするトレーニング方法が存在し、こうしたトレーニング方法は、利用可能なデータの増加に伴って行われる。
Incremental learning is a model in which a learning model can continue to learn as new data becomes available, without having to relearn based on the original data and new data.
増分学習は、新たなデータが利用可能になった場合に、元のデータ及び新たなデータに基づいて再学習を行うことなく学習モデルが学習を継続し得るモデルである。
Of course, most learning models, such as neural networks, may be retrained using all data that is available.
当然のことながら、ほとんどの学習モデル(ニューラルネットワークなど)は、利用可能なすべてのデータを使用して再度トレーニングできるものである。
[0162] Still further, the number of internal layers of a neural network may be increased to accommodate deep learning as the amount of data and processing approaches levels where deep learning may provide improvements in diagnosis.
【0147】
さらに、深層学習が診断の改善を見せ得るレベルへとデータ及び処理の量が近づくことに伴って、深層学習を適応させるためにニューラルネットワークの中間層の数を増やすことができる。
Several machine learning methods have been developed for deep learning.
深層学習については、機械学習方法がいくつか開発されている。
US10970498
[0033] As discussed above, according to some embodiments, the RFID decoding system includes a shallow learning network that generates simulated signals used to train a deep learning network to decode RFID tags.
【0014】
上述のように、いくつかの実施形態によれば、RFID復号システムは、深層学習ネットワークを訓練してRFIDタグを復号するために使用される模擬信号を生成する、浅い学習ネットワークを含む。
Shallow learning networks typically have one hidden layer, whereas deep learning networks use multiple hidden layers and pooling techniques.
浅い学習ネットワークは、典型的には、1つの隠れ層を有するが、深層学習ネットワークは、複数の隠れ層及びプーリング技術を使用する。
Shallow learners mainly depend on the modelling of features predictions, but deep learners can potentially extract better representations from the data which results in higher accuracy models.
浅い学習器は主に特徴予測のモデリングに依存するが、深層学習器は、データからより良好な表現を抽出する可能性があり、その結果、より高い精度のモデルが得られる。
More generally, the data augmentation processor may comprise any function estimator capable of simulating response signals for variations in one or more reading parameters, wherein a reading parameter may be a transmission parameter associated with transmission of the interrogation signal or a receive parameter associated with reception of the response signal from the RFID tag.
より一般的には、データ拡張プロセッサは、1つ以上の読み取りパラメータにおける変化に対する応答信号をシミュレートすることが可能な任意の関数推定器を備えてもよく、読み取りパラメータは、質問信号の送信に関連する送信パラメータ、又は、RFIDタグからの応答信号の受信に関連する受信パラメータであってもよい。
When the data augmentation processor is a shallow learner, the shallow learning is trained to produce the simulated response signals.
データ拡張プロセッサが浅い学習器である場合、浅い学習は、模擬応答信号を生成するように訓練される。
Both the data augmentation processor and the decoding processor may be trained using supervised learning in which the algorithm iteratively makes predictions on the training data and are corrected by a supervisor until the algorithm achieves an acceptable level of performance.
データ拡張プロセッサ及び復号化プロセッサは両方とも、アルゴリズムが訓練データに対する予測を反復的に行い、アルゴリズムが許容可能なレベルの性能を達成するまで、教師によって修正される教師あり学習を使用して訓練され得る。
According to some embodiments, the training dataset used to train the data augmentation processor is the set of measured test response signals.
いくつかの実施形態によれば、データ拡張プロセッサを訓練するために使用される訓練データセットは、測定されたテスト応答信号のセットである。
US10542143
[0073] In some implementations, the speech-to-text module 126 uses the speech API 128 to convert the audio data into text.
【0054】
いくつかの実装形態では、スピーチ-テキストモジュール126は、オーディオデータをテキストに変換するためにスピーチAPI128を使用する。
In some examples, the speech API 128 uses machine learning to convert the audio data into text.
いくつかの例では、スピーチAPI128は、オーディオデータをテキストに変換するために機械学習を使用する。
For example, the speech API 128 can use models that accept audio data as inputs.
たとえば、スピーチAPI128は、オーディオデータを入力として受け入れるモデルを使用することができる。
The speech API 128 may use
スピーチAPI128は、
any of a variety of models such as decision trees, linear regression models, logistic regression models, neural networks,
決定木、線形回帰モデル、ロジスティック回帰モデル、ニューラルネットワーク、
classifiers, support vector machines, inductive logic programming, ensembles of models (e.g., using techniques such as bagging, boosting, random forests, etc.),
分類器、サポートベクトルマシン、誘導論理プログラミング、モデルのアンサンブル(たとえば、バギング、ブースティング、ランダムフォレストなどの技法を使用する)、
genetic algorithms, Bayesian networks, etc.,
遺伝的アルゴリズム、ベイジアンネットワークなどの、様々なモデルのうちのいずれかを使用し得、
and can be trained using a variety of approaches, such as deep learning, perceptrons, association rules, inductive logic, clustering, maximum entropy classification, learning classification, etc.
深層学習、パーセプトロン、関連ルール、帰納的論理、クラスタリング、最大エントロピー分類、学習分類などの様々な手法を使用して訓練され得る。
In some examples, the speech API 128 may use supervised learning.
いくつかの例では、スピーチAPI128は教師付き学習を使用し得る。
In some examples, the speech API 128 uses unsupervised learning.
いくつかの例では、スピーチAPI128は教師なし学習を使用する。
In some examples, the speech API 128 can be accessed by the speech-to-text module 126 over a network.
いくつかの例では、スピーチAPI128は、ネットワークを介してスピーチ-テキストモジュール126によってアクセスされ得る。
For example, the speech API 128 can be provided by a remote third party on a cloud server.
たとえば、スピーチAPI128は、クラウドサーバ上の遠隔の第三者によって提供され得る。
US11210346
[0004] Based on the above context, this document describes a computing system that uses specific computing rules or instructions (e.g., a unique algorithm) to predict or generate commands based on a received user input.
【0004】
上記の背景に基づいて、この文書は受信したユーザ入力に基づいてコマンドを予測又は生成するための特定の演算ルール又は命令(例えば特殊なアルゴリズム)を使用する演算システムを記載する。
To generate the commands, the system is configured to train a predictive model using one or more learning algorithms (e.g., deep learning algorithms).
コマンドを生成するために、システムは1つ以上の学習アルゴリズム(例えば深層学習アルゴリズム)を使用する予測モデルを訓練するように構成される。
The predictive model is used to process terms that are recognized and extracted using a natural language processor (NLP) in an entity module of the system.
予測モデルはシステムのエンティティモジュールの自然言語プロセッサ(NLP)を使用して認識又は抽出される用語を処理するために使用される。
The predictive model can be trained to semantically understand relevant terms (e.g., medical and clinical terms) and their relations to other medical terms.
予測モデルは関連用語(例えば医療用語と臨床用語)と他の医療用語とのこれらの関係とを意味的に理解するように訓練されうる。
Terms can be extracted from information sources such as textbooks and online resources, or from unstructured datasets such as electronic medical data for multiple healthcare patients.
用語は例えば教科書やオンラインリソースのような情報源、又は複数の健康状態患者の電子医療データのような非構造化データセットから抽出されうる。
US2020194224
[0123] In some embodiments, the deep learning model is a generative model.
【0116】
ある種の実施形態ではその深層学習モデルが生成モデルとされる。
A generative model can be generally defined as a model that is probabilistic in nature.
生成モデルは、一般に、確率的な性質のモデルとして定義することができる。
In other words, a generative model is one that performs forward simulation or rule-based approaches.
言い換えれば、生成モデルは、フォワードシミュレーション又はルールベース法を実行するものである。
The generative model can be learned (in that its parameters can be learned) based on a suitable training set of data.
生成モデルの学習(ひいては諸パラメータの学習)は適切な訓練セットのデータに基づき行うことができる。
In one embodiment, the deep learning model is configured as a deep generative model.
一実施形態に係る深層学習モデルは深層生成モデルとして構成される。
For example, the model may be configured to have a deep learning architecture in that the model may include multiple layers, which perform a number of algorithms or transformations.
例えば、そのモデルを、深層学習アーキテクチャを呈するように構成すること、ひいてはそのモデルに複数個の層を設けそれらにより多数のアルゴリズム又は変換が実行されるようにすることができる。
US20200169593
[0029] Machine learning is a field of study that gives computers the ability to learn without being explicitly programmed.
【0017】
機械学習は、明示的にプログラムされずにコンピュータに学習する能力を与える学習分野である。
Machine learning explores the study and construction of algorithms, also referred to herein as tools, which may learn from existing data and make predictions about new data.
機械学習はアルゴリズムの研究及び構築を探求するものであり、それらは本明細書ではツール(tools)とも呼ばれ、既存のデータから学習し、新しいデータについて予測することができる。
Such machine-learning tools operate by building a model from example training data 112 in order to make data-driven predictions or decisions expressed as outputs or assessments 120 .
このような機械学習ツールは、例示的な訓練データ112からモデルを構築することによって動作し、データ駆動型の予測又は決定をアウトプット又は評価120として表現する。
Although example embodiments are presented with respect to a few machine-learning tools, the principles presented herein may be applied to other machine-learning tools.
例示的な実施形態が、少数の機械学習ツールに関して提示されているが、ここに提示された原理は、他の機械学習ツールに適用することができる。
[0040] Each model develops a rule or algorithm over several epochs by varying the values of one or more variables affecting the inputs to more closely map to a desired result, but as the training dataset may be varied, and is preferably very large, perfect accuracy and precision may not be achievable.
【0028】
各モデルは、入力に影響する1つ以上の変数の値を、所望の結果にもっと近似的にマッピングするように変化させることによって、数エポックにわたってルール又はアルゴリズムを開発するが、訓練データセットを変化させることができ、好ましくは非常に大きく、完全な精度及び精度を達成することができない。
A number of epochs that make up a learning phase, therefore, may be set as a given number of trials or a fixed time/computing budget, or may be terminated before that number/budget is reached when the accuracy of a given model is high enough or low enough or an accuracy plateau has been reached.
従って、学習フェーズを構成する多数のエポックは、所与の試行回数又は固定時間/計算予算として設定され得るか、又は所与のモデルの精度が十分に高いか、又は十分に低い場合、又は精度のプラトーに到達した場合、その数/予算に到達する前に終了され得る。
For example, if the training phase is designed to run n epochs and produce a model with at least 95% accuracy, and such a model is produced before the nth epoch, the learning phase may end early and use the produced model satisfying the end-goal accuracy threshold.
例えば、訓練フェーズがn個のエポックを実行し、少なくとも95%の精度を有するモデルを生成するように設計され、そのようなモデルがn番目のエポックより前に生成される場合、学習フェーズは早期に終了し、最終目標精度閾値を満足する生成モデルを使用することができる。
Similarly, if a given model is inaccurate enough to satisfy a random chance threshold (e.g., the model is only 55% accurate in determining true/false outputs for given inputs), the learning phase for that model may be terminated early, although other models in the learning phase may continue training.
同様に、与えられたモデルがランダムな偶然の閾値を満たすのに十分に不正確である場合(例えば、与えられた入力に対する真/偽の出力を決定する際に、モデルがわずか55%の正確さしかない場合)、そのモデルの学習フェーズは早期に終了してもよいが、学習フェーズの他のモデルは訓練を継続してもよい。
Similarly, when a given model continues to provide similar accuracy or vacillate in its results across multiple epochs—having reached a performance plateau—the learning phase for the given model may terminate before the epoch number/computing budget is reached.
同様に、所与のモデルが複数のエポックにわたって同様の精度を提供し続けるか、又はその結果にバラツキがある場合(パフォーマンスのプラトーに達した場合)、所与のモデルの学習フェーズは、エポック数/計算予算に到達する前に終了することができる。
EP3941333
[00199] In summary, construction of a NN machine learning model may include a learning (or training) stage and a classification (or operational) stage.
【0158】
概略すると、NN機械学習モデルの構成は、学習(又は訓練)ステージと分類(又は演算)ステージを含んでいてよい。
In the learning stage, the neural network may be trained for a specific purpose and may be provided with a set of training examples, including training (sample) inputs and training (sample) outputs, and optionally including a set of validation examples to test the progress of the training.
学習ステージでは、ニューラルネットワークは特定の目的のために訓練されてよく、また訓練例の集合が提供されてよく、これには訓練(サンプル)入力及び訓練(サンプル)出力が含まれ、任意選択により、訓練の進行状況を試験するためのバリデーションの例の集合が含まれる。
During this learning process, various weights associated with nodes and node-interconnections in the neural network are incrementally adjusted in order to reduce an error between an actual output of the neural network and the desired training output.
この学習プロセス中、ニューラルネットワーク内のノード及びノード相互接続に関係付けられる各種の重みが徐々に調整されて、ニューラルネットワークの実際の出力と所望の訓練出力との間のエラーが縮小される。
In this manner, a multi-layer feed-forward neural network (such as discussed above) may be made capable of approximating any measurable function to any desired degree of accuracy.
このようにして、多層フィードフォワードニューラルネットワーク(例えば前述のもの)は、何れの測定可能関数を何れの所望の精度までも概算できるかもしれない。
The result of the learning stage is a (neural network) machine learning (ML) model that has been learned (e.g., trained).
学習ステージの結果として得られるのは、学習した(例えば、訓練済みの)(ニューラルネットワーク)機械学習(ML)である。
In the operational stage, a set of test inputs (or live inputs) may be submitted to the learned (trained) ML model, which may apply what it has learned to produce an output prediction based on the test inputs.
演算ステージで、試験入力(又はライブ入力)の集合が学習済み(訓練済み)MLモデルに提供されてよく、それが学習したことを応用して、試験入力に基づいて出力予測を生成するかもしれない。
US2021312697
[0190] Supervised learning is a learning method in which training is performed as a mediated operation, such as when the training dataset 1102 includes input paired with the desired output for the input, or where the training dataset includes input having known output and the output of the neural network is manually graded.
【0190】
教師あり学習とは、訓練データセット1102が入力に対する所望の出力と組み合わされた入力を含む場合、又は訓練データセットが既知の出力を有する入力を含み、ニューラルネットワークの出力が手動で格付けされる場合などに、訓練が仲介オペレーションとして行われる学習方法である。
The network processes the inputs and compares the resulting outputs against a set of expected or desired outputs. Errors are then propagated back through the system.
ネットワークは入力を処理し、得られた出力を、期待される出力又は所望の出力のセットと比較する。次に誤差は、システムを通じて後方に伝搬される。
The training framework 1104 can adjust to adjust the weights that control the untrained neural network 1106 .
訓練フレームワーク1104は、訓練前のニューラルネットワーク1106を制御する重みを調整するように調整できる。
The training framework 1104 can provide tools to monitor how well the untrained neural network 1106 is converging towards a model suitable to generating correct answers based on known input data.
訓練フレームワーク1104は、訓練前のニューラルネットワーク1106が、既知の入力データに基づいて、正解を生成するのに好適なモデルに向かってどの程度収束しているかを監視するツールを提供できる。
The training process occurs repeatedly as the weights of the network are adjusted to refine the output generated by the neural network.
ニューラルネットワークにより生成される出力を改善するためにネットワークの重みが調整されると、訓練プロセスが繰り返し行われる。
The training process can continue until the neural network reaches a statistically desired accuracy associated with a trained neural net 1108 .
ニューラルネットワークが、訓練済みのニューラルネット1108と関連づけられた統計的に所望の精度に達するまで、訓練プロセスは継続してよい。
The trained neural network 1108 can then be deployed to implement any number of machine learning operations to generate an inference result 1114 based on input of new data 1112 .
次いで、訓練済みのニューラルネットワーク1108は、新たなデータ1112の入力に基づいて推論結果1114を生成する任意の数の機械学習操作を実装するために展開されてよい。
[0191] Unsupervised learning is a learning method in which the network attempts to train itself using unlabeled data.
【0191】
教師なし学習とは、ネットワークがラベルなしデータを用いて自ら訓練を試みる学習方法である。
Thus, for unsupervised learning the training dataset 1102 will include input data without any associated output data.
したがって教師なし学習の場合、訓練データセット1102は、関連づけられた出力データを何も持たない入力データを含むことになる。
The untrained neural network 1106 can learn groupings within the unlabeled input and can determine how individual inputs are related to the overall dataset.
訓練前のニューラルネットワーク1106は、ラベルなし入力のグループ分けを学習でき、個々の入力がどれだけデータセット全体に関連しているかを判定できる。
Unsupervised training can be used to generate a self-organizing map, which is a type of trained neural network 1108 capable of performing operations useful in reducing the dimensionality of data.
教師なし訓練は、自己組織化マップを生成するのに用いられてよく、これは、データの次元を削減する際に役立つ操作を実行できる訓練済みのニューラルネットワーク1108の一種である。
Unsupervised training can also be used to perform anomaly detection, which allows the identification of data points in an input dataset that deviate from the normal patterns of the data.
教師なし訓練は、異常検出を行うのにも用いられてよく、これにより、データの通常のパターンから外れた入力データセット内のデータ点を識別するのが可能になる。
US10576380
[0001] The present disclosure is related to artificial intelligence (AI) model training, and more specifically to
【0001】
本開示は、人工知能(AI)モデルの訓練あるいはトレーニングに関し、より詳細には、
using a network of server consoles of a game cloud system to farm training data associated with remote players, the training data used for AI model training.
ゲームクラウドシステムのサーバコンソールのネットワークを使用して、リモートプレーヤに関連する訓練データを集めることに関しており、訓練データはAIモデルの訓練に使用される。
BACKGROUND OF THE DISCLOSURE
【背景技術】
[0002] Artificial intelligence algorithms are designed to learn from data.
【0002】
人工知能アルゴリズムは、データから学習するように設計されている。
An AI model can be built based on the learned data, and is flexible enough to perform multiple functions depending on the input provided to the AI model.
AIモデルは、学習されたデータに基づいて構築することができ、AIモデルに与えられる入力に応じて複数の機能を実行するのに十分な柔軟性を有する。
[0003] However, providing the data to train an AI model is complex.
【0003】
しかし、AIモデルを訓練するためのデータの提供は複雑である。
In a less than straightforward example, an AI model configured for recognizing objects is trained using a vast number of object images.
簡単ではない例では、物体を認識するために構成されるAIモデルは、膨大な数の物体画像を使用して訓練される。
For example, a vast number of object images are used for training the AI model.
例えば、膨大な数の物体画像がAIモデルの訓練に使用される。
Generation and collection of those images is difficult and very time consuming. Basically, the AI model is trained to recognize every type of object that exists.
これらの画像の生成と収集は難しく、非常に時間がかかる。基本的に、AIモデルは、存在するあらゆる種類の物体を認識するように訓練される。
Imagine trying to collect for each object multiple images of that object that are taken from different perspectives.
物体ごとに、違う視点から撮られた、その物体の複数の画像を収集しようとすることを想像されたい。
In that manner, when presented with a new image of an object, the AI model can extract various identifying characteristics (e.g., outline, color, features, size, etc.) to determine if those characteristics match those of a learned object.
そのようにして、AIモデルに物体の新しい画像が提示されると、AIモデルは様々な識別特性(例えば、輪郭、色、特徴、サイズなど)を抽出して、それらの特性が学習した物体の特性と一致するかどうかを判断することができる。
The number of objects is limitless, and various views of those objects are also limitless.
物体の数は無限であり、それらの物体の様々な見方も無限である。
As such, the training of the AI model to recognize objects can be an ongoing process.
そのため、物体を認識するためのAIモデルの訓練は、継続的なプロセスとなり得る。
For example, the modeler 120 within the deep learning engine 190 may operate to set the parameters defined within the deep learning engine 190 that define the various nodes in the input layer 191 , hidden layers 192 , and output layer 193 , for purposes applying the trained AI model 160 within the deep learning engine 190 .
例えば、深層学習エンジン190内のモデラ120は、訓練されたAIモデル160を深層学習エンジン190内で適用する目的のために、入力層191、隠れ層192、及び出力層193の様々なノードを定義する深層学習エンジン190内で定義されたパラメータを設定するように動作し得る。
The modeler 120 may set the parameters in the AI model 160 based on one or more success criteria used during training, as previously described.
モデラ120は、上記のとおり、訓練中に使用される1つ以上の成功基準に基づいて、AIモデル160のパラメータを設定することができる。
In that manner, the AI model 160 is trained to learn the intricacies of the gaming application and/or the intricacies of playing the gaming application so that the AI model 160 can be used to provide various functionalities in relation to the gaming application and/or a game play of the gaming application
そのようにして、AIモデル160は、ゲームアプリケーション及び/またはゲームアプリケーションのゲームプレイに関連して様々な機能性を提供するためにAIモデル160を使用することができるように、ゲームアプリケーションの複雑な細部及び/またはゲームアプリケーションのプレイの複雑な細部を学習するように訓練される。
(e.g., predicting and/or determining what actions, to include controller inputs, to take in response to a given condition, such as game state).
(例えば、ゲーム状態などの所与の状況に応答して、コントローラ入力を含む、どのようなアクションを取るべきかを予測及び/または決定する)。
As such, the analyzer 140 is able to analyze the output from the AI model 160 responding to input defining a condition of a game play, and optionally the input (e.g., input state data), in order to provide an appropriate response to the condition,
したがって、分析器140は、状況への適切な応答を提供するために、ゲームプレイの状況を定義する入力を受けて、AIモデル160からの出力、及び任意選択で入力(例えば、入力状態データ)を分析することができる。
wherein the response may be dependent on a predefined objective (e.g., provide assistance, providing coaching, etc.).
ここで応答は、予め定義された目的(例えば、支援の提供、指導の提供など)に依存し得る。
For example, for a given set of training state data, such as for a training instance, a learned output of the AI model 160 may be analyzed by the analyzer 140 to determine the next set of controller inputs for controlling the corresponding game play.
例えば、訓練インスタンスなどの所与の訓練状態データのセットについて、AIモデル160の学習済み出力が、対応するゲームプレイを制御するためのコントローラ入力の次のセットを決定するために、分析器140によって分析されてもよい。
US2020348628
[0003] To improve the control of a system of interest, a hybrid controller may be provided that includes both dynamic components (e.g., filters or other dynamic controller elements) and components that have been specified to model the system under control (e.g., a learned system model trained based on observed past behaviors of the system under control).
【0003】
対象のシステムの制御を改善するために、動的構成要素(例えば、フィルタまたはその他の動的コントローラ要素)と、制御対象システムをモデリングするために指定された構成要素(例えば、制御対象システムの観測された過去の挙動に基づいて訓練された学習済みシステムモデル)との両方を含むハイブリッドコントローラが提供され得る。
Such a hybrid controller may provide better outputs, with respect to controlling the output of the system or with respect to some other operational parameter of interest, relative to alternative controllers that only include dynamic elements or system-modeling elements.
このようなハイブリッドコントローラは、動的要素またはシステムモデリング要素のみを含む代替コントローラと比較して、システムの出力を制御することに関して、または他のいくつかの対象動作パラメータに関して、出力を向上させることができる。
Hybrid controllers may also be implemented cost-effectively and with minimal compute resources (e.g., cycles, memory, cores).
また、ハイブリッドコントローラは、コスト効率良く、計算リソース(例えば、サイクル、メモリ、コア)を最小限に抑えて実施することもできる。
Hybrid controllers are able to generate control outputs that may take into account learned information about the complex structure of the controlled system (via the system-modeling component) while also providing certain formal guarantees regarding the performance of the hybrid controller (due to the presence of the analytically-tractable dynamic component).
ハイブリッドコントローラは、その性能に関して(分析的に扱いやすい動的構成要素の存在のため)特定の形式的な保証を提供しながらも、被制御システムの複合体構造に関する学習済み情報を(システムモデリング構成要素を介して)考慮に入れ得る制御出力を生成することができる。