メモ
LINEスタンプの作り方 スマートフォンだけで「ぱぱにゃん」スタンプを作ってみた
http://www.itmedia.co.jp/news/articles/1706/20/news121.html
「作れる」ということと「審査が通る」ということは、違うよ・・・
LINEスタンプの作り方 スマートフォンだけで「ぱぱにゃん」スタンプを作ってみた
http://www.itmedia.co.jp/news/articles/1706/20/news121.html
「作れる」ということと「審査が通る」ということは、違うよ・・・
下記記事中にでてくる
販売を手がける角田(かくた)無線電機
って、あの秋葉原で無線機売ってた、X-1の角田さん?
「aiwaは日本で生まれた宝物」三井知則社長、9年ぶり復活の理由を語る
http://www.huffingtonpost.jp/2017/06/21/aiwa-returns_n_17238608.html
販売を手がける角田(かくた)無線電機
って、あの秋葉原で無線機売ってた、X-1の角田さん?
「aiwaは日本で生まれた宝物」三井知則社長、9年ぶり復活の理由を語る
http://www.huffingtonpost.jp/2017/06/21/aiwa-returns_n_17238608.html
やっちゃいそうなので、メモメモ・・・
CDN切り替え作業における、Web版メルカリの個人情報流出の原因につきまして
http://tech.mercari.com/entry/2017/06/22/204500
これに限らず、エンドツーエンドの試験、社外のネットワークからアクセスしないと、
ほんとのところ、やばいよね・・
【6月28日追加】
メルカリの個人情報流出、陥った「no-cache」の罠
http://itpro.nikkeibp.co.jp/atcl/column/14/346926/062601030/
CDN切り替え作業における、Web版メルカリの個人情報流出の原因につきまして
http://tech.mercari.com/entry/2017/06/22/204500
これに限らず、エンドツーエンドの試験、社外のネットワークからアクセスしないと、
ほんとのところ、やばいよね・・
【6月28日追加】
メルカリの個人情報流出、陥った「no-cache」の罠
http://itpro.nikkeibp.co.jp/atcl/column/14/346926/062601030/
REST APIは、Swaggerを使う形になってきているのかしら?
で、API管理は、昨日
GUIで、Web APIのJSON,SOAP,XML変換やAPIキーチェック、認証、トラフィック制御ができる
http://blog.goo.ne.jp/xmldtp/e/e1283276521c9b978b423ad0d59ceb1d
で聞いてきたようにApigee Edgeなどがある。
詳しくは、以下の記事。
API管理ツール、OSSも登場して戦国時代へ
http://itpro.nikkeibp.co.jp/atcl/column/14/346926/012500793/
で、問題は、Swaggerで定義したAPIを、API管理ツールで管理できるのか?
という話。
富士通のAPI Manager、つまり、Apigee Edgeでは、できるという話を聞いてきた
(具体的には、APIを登録するとき、API Proxyの登録ということをする。
この登録画面の、Build a Proxyで、
Proxy bundle
を選択すると、Swaggerで作ったAPIをインポートしてくれるらしい。
ちなみに、昨日のエントリの上にある、GUIでAPI認証やマッシュアップ、JSON変換
などを行う画面だけど、あれはConditional Flowといわれ、API Proxy editor画面
で編集する。それを出すには、上記登録をして、各APIの画面が出たら、DEVELOPタブ
をクリックすると出てくる)
で、オープンソースのAPI管理ツールのKongでは出来るのか?っていうのを、
今研究中(って、今日のお仕事の内容違う気が ^^;)。
で、API管理は、昨日
GUIで、Web APIのJSON,SOAP,XML変換やAPIキーチェック、認証、トラフィック制御ができる
http://blog.goo.ne.jp/xmldtp/e/e1283276521c9b978b423ad0d59ceb1d
で聞いてきたようにApigee Edgeなどがある。
詳しくは、以下の記事。
API管理ツール、OSSも登場して戦国時代へ
http://itpro.nikkeibp.co.jp/atcl/column/14/346926/012500793/
で、問題は、Swaggerで定義したAPIを、API管理ツールで管理できるのか?
という話。
富士通のAPI Manager、つまり、Apigee Edgeでは、できるという話を聞いてきた
(具体的には、APIを登録するとき、API Proxyの登録ということをする。
この登録画面の、Build a Proxyで、
Proxy bundle
を選択すると、Swaggerで作ったAPIをインポートしてくれるらしい。
ちなみに、昨日のエントリの上にある、GUIでAPI認証やマッシュアップ、JSON変換
などを行う画面だけど、あれはConditional Flowといわれ、API Proxy editor画面
で編集する。それを出すには、上記登録をして、各APIの画面が出たら、DEVELOPタブ
をクリックすると出てくる)
で、オープンソースのAPI管理ツールのKongでは出来るのか?っていうのを、
今研究中(って、今日のお仕事の内容違う気が ^^;)。
ネットワークには、大きなトランザクションバックログがあります。この輻輳は、昨日のステータスICOによって部分的に引き起こされていますが、他の要因も同様に作用しているかどうかは不明です。
とのこと
現在日々、ICOが繰り広げられており、しかもEthereumブロックチェーン上に構築されたステータスが巨額(巨大)になっています。
ということらしい・・・
その結果
しかし、販売が始まるとすぐにネットワークが混雑し、ステータスチームは誰もが約束したトークンをすぐに提供することができませんでした。
残念ながら、2つの取引所がEthereum財布を無効にしてしまいました。これは、この技術の未熟さを示すため、Ethereumの大きな問題です。
まじ(@_@!)
仮想通貨Ethereum(イーサ)ネットワーク混雑|詐欺ICO懸念、オーバーロード引き起こす問題
http://virtualmoney.jp/I0001146/
(太字は上記サイトより引用)
※ICO(クラウドセール)とは?
ICO(Initial Coin Offering)は企業またはプロジェクトが自らのトークンやコイン(従来の金融市場における株式のようなもの)を発行し資金調達を行うプロセスである。そしてそのトークンが暗号通貨取引所に上場されることである。
(http://cryptocurrencymagazine.com/what-is-ico-crowdsaleより引用)
とのこと
現在日々、ICOが繰り広げられており、しかもEthereumブロックチェーン上に構築されたステータスが巨額(巨大)になっています。
ということらしい・・・
その結果
しかし、販売が始まるとすぐにネットワークが混雑し、ステータスチームは誰もが約束したトークンをすぐに提供することができませんでした。
残念ながら、2つの取引所がEthereum財布を無効にしてしまいました。これは、この技術の未熟さを示すため、Ethereumの大きな問題です。
まじ(@_@!)
仮想通貨Ethereum(イーサ)ネットワーク混雑|詐欺ICO懸念、オーバーロード引き起こす問題
http://virtualmoney.jp/I0001146/
(太字は上記サイトより引用)
※ICO(クラウドセール)とは?
ICO(Initial Coin Offering)は企業またはプロジェクトが自らのトークンやコイン(従来の金融市場における株式のようなもの)を発行し資金調達を行うプロセスである。そしてそのトークンが暗号通貨取引所に上場されることである。
(http://cryptocurrencymagazine.com/what-is-ico-crowdsaleより引用)
6月22日
Works Applications NLPエンジニアによる自然言語処理の実用化に向けた勉強会
に行ってきた!ので、内容メモメモ
■ご案内(人事の人)
・Wifiはないよ
・アンケートは途中で帰っても、書いてね
・つぶやいて ハッシュタグ WAP_TECH
・アジェンダ
・WAP会社概要
・とーく1
・とーく2:形態素解析
・WAPについて
徳島→自然言語処理に特化した研究所
ERP:日本の中ではトップシェア
HUE:世界の「働く」を変える 動画
人工知能型ERP
■ERPと自然言語処理
・自己紹介
・ワークス徳島人工知能NLP研究所
働き方に技術でブレークスルーを起こす
・徳島県がIT企業
AI(あい)
・ERPとは
ひとものかね
HRシリーズ
ACシリーズ
SCM
ECシリーズ
ERP:つかいにくい→バックオフィスのため
・動画
1億円の不便と0円の便利
ERPソフト VS Google
・HUE
0.1秒の応答速度
AIの活用
1200社超の業務ノウハウ
HUEの人工知能=インプットレス
コンシューマITのあたりまえをエンタープライズITに
・課題とアプローチ
Enterprise Serch
データ入力業務の効率化
・Enterprise Search
Try&Errorを繰り返せる
多様なデータソースを横断して検索
業務にFocusし、ほしい情報に素早くたどり着ける
サジェスト:サーチ内容に特化したサジェスト
エンタープライズサーチ(全社横断)
エンタープライズコラボレーション機能
HUE独自機能
業務ごとのチューニングはプロダクト開発の役割
チューニングを効率化、もしくは不要にするための仕組み・技術の開発
辞書を簡単に編集・繁栄できるフレームワーク
大規模なシステム辞書の開発(形態素、同義語)
表記ゆれ・動議表現の自動抽出技術の研究開発
社内でしか使われない用語、業種ごとに使われ方が違う語は共通辞書には入れられない
CEO
前後の文脈
ユーザー環境にあるデータから自動構築が必要
適合率重視のタスク
言語現象を分析、減少ごとに異なるアプローチ
単純な抽出タスクではない
さまざまな情報源、技術の組み合わせによるチャレンジ
さまざまなデータ入力業務
効率化、入力支援 HUE
→マジックペースト
課題とアプローチ
・業務ごとにとりたい項目が異なる
業務ごとにモデルを作成
・文書からの語句抽出ではない→令案と情報を文脈として活用
大規模辞書も併用
・手書き・画像への対応
もう一つの研究チーム
ユーザー企業ごとに扱うフォーマットはバラバラ
企業ごとはバラバラ、でも1企業が扱うフォーマットはある程度固定
使い込めば精度向上
操作・修正ログを用いた機械学習
→ログからOverFittingぎみに個別企業特化モデル
→履歴書は通用しない
その他の研究テーマ
NLP要素技術の研究開発
成果の一部はOSSで公開
Chatbotの実用化
FAQ Bot(社内の),スケジューラBot,タレントサーチbot
目的特価
新しい働き方を提案する機能の研究開発
メンタルヘルスリスク、退職リスクの早期検出
→秋には公開できる?(今は話せない)
隠れたはいパフォーマー人材の検出・分析
・最後に
ERP→NLP、機械学習
業務フローの分析
■形態素解析の話
・自己紹介
・形態素解析とは
伝統的な自然言語処理の階層
応用:情報検索、翻訳
要素技術;いいかえ、照応
基礎:形態素、構文、述語項
形態素解析の3要素
セグメンテーション:分割
すてみんぐ(れんまたいぜーしょん):辞書型に
パートオブスピーチタギング:品詞
共通接頭辞検索とらてぃす
部分文字列がいっぺんにみれる
→トライ構造
→らてぃすがくめる
トライ構造をどう作るか
めかぶ、ちゃせん:W配列、スキップリスト・・・いろんなやりかた
→FST(くろもじ)とWあれいが多い
コスト付け
N-Gramモデル
マルコフ連鎖を想定
Wn=W1,W2・・・Wnの生起確率→前方に依存
(N-1)語のみいぞんとする(そこまでをかける)
最優推定、条件付き確立場(CRF)
→かな漢字変換も
徳永さん 日本語入力を支える技術
その他の機能
表記正規化:送り仮名、異体字
読み付与:よみがな、はつおん、れんだく
派生:可能動詞、自動詞、他動詞(じゅまん)
既存のオープンソース形態素解析器と辞書
MeCab:IPADIE,UniDIc(+NEologd),JUMAN辞書
Juman:JUMAN
KyTea:点推定を使ったモデル
辞書の話
UniDic:
国立国語研究所短単位
誰がタグ付けしても再現できる(手続きで決まっている)
学習コーパスBCCWJ
難点:短すぎ、分割ルールが直観的ではない、固有名詞が不足
IPADIC:
IPA品詞体系:学校文法に近い、分割長ほどほど、粒度にばらつき
学習コーパス:RWCPコーパス:非公開
難点:メンテナンスとまっている、OSS非互換(ICOT条項)、NAIST-jdicも停止
NEologd
IPADICを補完:固有名詞・複合名詞を1語として登録、UniDic版も
Webからの語彙収集:システムによる自動、半自動
コスト推定:単語精製コストをコーパスを使わず調整
JUMAN
益岡、田窪文法に基づく:癖のある品詞(な形)
パラメータは人手:JUMAN++ではNNも利用
付加情報が多い
間欠的にメンテナンス:JUMAN++は語彙追加も
→つかうとなると、IPADICにNEologdがいいかな
TIPS
・前処理は大切
脆弱:文字コード、改行、言語、テキストでないもの
構造情報は別に
特殊なものは専用のパーサーで
・単語追加
再学習はしない:結果がブレブレ、コーパスの調達、手で調整
人手調整:品詞ちゃんときめる(MeCabの連接ID)
生起コストは適当でも大丈夫
→解析はおおむね品詞連接コストで決まる
・単語追加の注意点
単語追加を避けるべき語
一般的な語の品詞違い「みんな」
短い語:社員名簿
ひらがな語「なのは」問題 なのはを人名にすると・・・
解析を強制したい
特定の文字列の解析を一定にしたい
→文字列を1語で登録 負荷情報に分割位置
・使いやすい形態素解析
語の同定
切って、品詞つけるだけで十分
細かい品詞分類はいらない、つかえる分割単位か、何に使うのか
その後がなんなのか
ほかの資源との関連付け、Entity Linking,Wikification、同義語・概念辞書
解析の一貫性
わかったことは出力
VS
状況にかかわらず一定
分割の粒度
ほしい長さはアプリケーションによって違う
既知語と未知語で粒度が変わる
・形態素解析器 Sudachi
オープンソース、開発もオープン、辞書も作る
Javaで
語の同定
ブラックボックスだとできないこと
やりたいこと
複数の文辰単位
UniDIC+NEologd
継続的なメンテナンス
機能のプラグイン
同義語辞書との連携
分割単位
A単位:UniDic
B単位:IPADIC
C単位:NEologd
略語は同義語で
プラグイン形式でフックして処理を差し込める
大規模使用時の省メモリ化
複数VMでメモリ共有
8月中旬初版リリース予定!
Works Applications NLPエンジニアによる自然言語処理の実用化に向けた勉強会
に行ってきた!ので、内容メモメモ
■ご案内(人事の人)
・Wifiはないよ
・アンケートは途中で帰っても、書いてね
・つぶやいて ハッシュタグ WAP_TECH
・アジェンダ
・WAP会社概要
・とーく1
・とーく2:形態素解析
・WAPについて
徳島→自然言語処理に特化した研究所
ERP:日本の中ではトップシェア
HUE:世界の「働く」を変える 動画
人工知能型ERP
■ERPと自然言語処理
・自己紹介
・ワークス徳島人工知能NLP研究所
働き方に技術でブレークスルーを起こす
・徳島県がIT企業
AI(あい)
・ERPとは
ひとものかね
HRシリーズ
ACシリーズ
SCM
ECシリーズ
ERP:つかいにくい→バックオフィスのため
・動画
1億円の不便と0円の便利
ERPソフト VS Google
・HUE
0.1秒の応答速度
AIの活用
1200社超の業務ノウハウ
HUEの人工知能=インプットレス
コンシューマITのあたりまえをエンタープライズITに
・課題とアプローチ
Enterprise Serch
データ入力業務の効率化
・Enterprise Search
Try&Errorを繰り返せる
多様なデータソースを横断して検索
業務にFocusし、ほしい情報に素早くたどり着ける
サジェスト:サーチ内容に特化したサジェスト
エンタープライズサーチ(全社横断)
エンタープライズコラボレーション機能
HUE独自機能
業務ごとのチューニングはプロダクト開発の役割
チューニングを効率化、もしくは不要にするための仕組み・技術の開発
辞書を簡単に編集・繁栄できるフレームワーク
大規模なシステム辞書の開発(形態素、同義語)
表記ゆれ・動議表現の自動抽出技術の研究開発
社内でしか使われない用語、業種ごとに使われ方が違う語は共通辞書には入れられない
CEO
前後の文脈
ユーザー環境にあるデータから自動構築が必要
適合率重視のタスク
言語現象を分析、減少ごとに異なるアプローチ
単純な抽出タスクではない
さまざまな情報源、技術の組み合わせによるチャレンジ
さまざまなデータ入力業務
効率化、入力支援 HUE
→マジックペースト
課題とアプローチ
・業務ごとにとりたい項目が異なる
業務ごとにモデルを作成
・文書からの語句抽出ではない→令案と情報を文脈として活用
大規模辞書も併用
・手書き・画像への対応
もう一つの研究チーム
ユーザー企業ごとに扱うフォーマットはバラバラ
企業ごとはバラバラ、でも1企業が扱うフォーマットはある程度固定
使い込めば精度向上
操作・修正ログを用いた機械学習
→ログからOverFittingぎみに個別企業特化モデル
→履歴書は通用しない
その他の研究テーマ
NLP要素技術の研究開発
成果の一部はOSSで公開
Chatbotの実用化
FAQ Bot(社内の),スケジューラBot,タレントサーチbot
目的特価
新しい働き方を提案する機能の研究開発
メンタルヘルスリスク、退職リスクの早期検出
→秋には公開できる?(今は話せない)
隠れたはいパフォーマー人材の検出・分析
・最後に
ERP→NLP、機械学習
業務フローの分析
■形態素解析の話
・自己紹介
・形態素解析とは
伝統的な自然言語処理の階層
応用:情報検索、翻訳
要素技術;いいかえ、照応
基礎:形態素、構文、述語項
形態素解析の3要素
セグメンテーション:分割
すてみんぐ(れんまたいぜーしょん):辞書型に
パートオブスピーチタギング:品詞
共通接頭辞検索とらてぃす
部分文字列がいっぺんにみれる
→トライ構造
→らてぃすがくめる
トライ構造をどう作るか
めかぶ、ちゃせん:W配列、スキップリスト・・・いろんなやりかた
→FST(くろもじ)とWあれいが多い
コスト付け
N-Gramモデル
マルコフ連鎖を想定
Wn=W1,W2・・・Wnの生起確率→前方に依存
(N-1)語のみいぞんとする(そこまでをかける)
最優推定、条件付き確立場(CRF)
→かな漢字変換も
徳永さん 日本語入力を支える技術
その他の機能
表記正規化:送り仮名、異体字
読み付与:よみがな、はつおん、れんだく
派生:可能動詞、自動詞、他動詞(じゅまん)
既存のオープンソース形態素解析器と辞書
MeCab:IPADIE,UniDIc(+NEologd),JUMAN辞書
Juman:JUMAN
KyTea:点推定を使ったモデル
辞書の話
UniDic:
国立国語研究所短単位
誰がタグ付けしても再現できる(手続きで決まっている)
学習コーパスBCCWJ
難点:短すぎ、分割ルールが直観的ではない、固有名詞が不足
IPADIC:
IPA品詞体系:学校文法に近い、分割長ほどほど、粒度にばらつき
学習コーパス:RWCPコーパス:非公開
難点:メンテナンスとまっている、OSS非互換(ICOT条項)、NAIST-jdicも停止
NEologd
IPADICを補完:固有名詞・複合名詞を1語として登録、UniDic版も
Webからの語彙収集:システムによる自動、半自動
コスト推定:単語精製コストをコーパスを使わず調整
JUMAN
益岡、田窪文法に基づく:癖のある品詞(な形)
パラメータは人手:JUMAN++ではNNも利用
付加情報が多い
間欠的にメンテナンス:JUMAN++は語彙追加も
→つかうとなると、IPADICにNEologdがいいかな
TIPS
・前処理は大切
脆弱:文字コード、改行、言語、テキストでないもの
構造情報は別に
特殊なものは専用のパーサーで
・単語追加
再学習はしない:結果がブレブレ、コーパスの調達、手で調整
人手調整:品詞ちゃんときめる(MeCabの連接ID)
生起コストは適当でも大丈夫
→解析はおおむね品詞連接コストで決まる
・単語追加の注意点
単語追加を避けるべき語
一般的な語の品詞違い「みんな」
短い語:社員名簿
ひらがな語「なのは」問題 なのはを人名にすると・・・
解析を強制したい
特定の文字列の解析を一定にしたい
→文字列を1語で登録 負荷情報に分割位置
・使いやすい形態素解析
語の同定
切って、品詞つけるだけで十分
細かい品詞分類はいらない、つかえる分割単位か、何に使うのか
その後がなんなのか
ほかの資源との関連付け、Entity Linking,Wikification、同義語・概念辞書
解析の一貫性
わかったことは出力
VS
状況にかかわらず一定
分割の粒度
ほしい長さはアプリケーションによって違う
既知語と未知語で粒度が変わる
・形態素解析器 Sudachi
オープンソース、開発もオープン、辞書も作る
Javaで
語の同定
ブラックボックスだとできないこと
やりたいこと
複数の文辰単位
UniDIC+NEologd
継続的なメンテナンス
機能のプラグイン
同義語辞書との連携
分割単位
A単位:UniDic
B単位:IPADIC
C単位:NEologd
略語は同義語で
プラグイン形式でフックして処理を差し込める
大規模使用時の省メモリ化
複数VMでメモリ共有
8月中旬初版リリース予定!
っていうのがApigee Edge(あぴじーえっじ)で、
富士通は、それをAPI ManagerとしてクラウドK5で提供しているみたいよ!
富士通のAPI Managerの講習会行ってきた!
はじめは、トラフィック制御ぐらいかなあ~と思ったら、
こういう画面
(http://d3grn7b5c5cnw5.cloudfront.net/sites/docs/files/SpikeArrestInProxyEditorPreFlow_v2a.pngより引用)
で、 GUIで、
・JSON変換とか、データベースから値をとってくるとか、認証とかそういう
部品を登録して(左上)
・それを、APIが呼び出されてから、帰るまでの間のどこで使うかをドロップして(右上)
・各部品を修正する
というのをやってAPIをつくることができるものみたい。
だから、もちろん既存APIのトラフック制御や認証ができるけど、
それ以外に、新規に、会社にあるDBから値をとってきて、HTMLで出力するみたいな
テンプレートエンジンみたいなことも出来るみたい!
で、ついでに統計情報とかも見れる感じ。
富士通のAPI ManagementはApigee Edgeなので(っていうか、上の図はApigee Edgeのもの)
Apigee Edgeもおなじことができる(富士通以外でも売っている)
GUI操作&下にHTMLなどをちょっと書けばAPIが作成できるので、
開発の人だけでなく、エンドユーザーがAPI作って
開発の人が要らなくなるかも!!
「参考文献」
API Facade Pattern
https://pages.apigee.com/api-facade-pattern-ebook.html
富士通は、それをAPI ManagerとしてクラウドK5で提供しているみたいよ!
富士通のAPI Managerの講習会行ってきた!
はじめは、トラフィック制御ぐらいかなあ~と思ったら、
こういう画面
(http://d3grn7b5c5cnw5.cloudfront.net/sites/docs/files/SpikeArrestInProxyEditorPreFlow_v2a.pngより引用)
で、 GUIで、
・JSON変換とか、データベースから値をとってくるとか、認証とかそういう
部品を登録して(左上)
・それを、APIが呼び出されてから、帰るまでの間のどこで使うかをドロップして(右上)
・各部品を修正する
というのをやってAPIをつくることができるものみたい。
だから、もちろん既存APIのトラフック制御や認証ができるけど、
それ以外に、新規に、会社にあるDBから値をとってきて、HTMLで出力するみたいな
テンプレートエンジンみたいなことも出来るみたい!
で、ついでに統計情報とかも見れる感じ。
富士通のAPI ManagementはApigee Edgeなので(っていうか、上の図はApigee Edgeのもの)
Apigee Edgeもおなじことができる(富士通以外でも売っている)
GUI操作&下にHTMLなどをちょっと書けばAPIが作成できるので、
開発の人だけでなく、エンドユーザーがAPI作って
開発の人が要らなくなるかも!!
「参考文献」
API Facade Pattern
https://pages.apigee.com/api-facade-pattern-ebook.html
6月21日
データサイエンティスト協会 セミナー2017 第2回
に行ってきた!ので内容メモメモ
■おしらせ
・Data Science Awardについて
■会場について
・内田洋行 ゆびきたすきょうそうひろば きゃんばす
築46年のビルだけど、リノベーションした
■基礎から学ぶ!
インダストリアルIoTの実現に必須の
センサ計測とエッジコンピューティング
・会社紹介
ラボビュー
一社だけでは実現できないインダストリアルIoT
NIは計測制御装置のプロフェッショナル
高い接続性
産業界での協業事例 IIC TestBed
・予知保全の動向と課題
インダストリアルIoT
コンシューマーIoT
予知保全への期待が高い
モニタリングには2種類あり、目的が異なる
プロセスモニタリング:プラントマネジメント
生産設備のモニタリング:予知保全
・設備不具合の大半は回転機械の振動問題
モーターの故障モード
ベアリング、ステーター
各種センサーを用いた予知保全
加速度(振動)センサー
・課題
業界を超えた協力体制の必要性
センサー計測時の課題
・莫大な量のデータを処理しきれない計測器とクラウド
激増するBigData
→センサーから取得するデータ
→アナログデータ:BigAnalogData
AEセンサー:17Mバイト/秒
赤外線:18MB/秒
→ネットワークのトラフィックが耐えられない
レスポンスが間に合わない
・エッジコンピューティングによる重要データの抽出がカギとなる
1.莫大なデータを演算処理し、意味ある情報に変換
2.データ管理
周波数分析・ピークToピーク
・産業向けのデータサイエンティストが
特徴抽出を計測装置内で行い、データ量を絞る
センサー 計測 特徴注抽出 特徴量 特徴選択・次元削減
AR機能で保全
スマートポンプデモにおけるエッジコンピューティングの例
→必要最低限のセンサーからとってくる
人間じゃできないようなもの
・OTやとして困っていること
お客様は計測はこれから。しかし機械学習について質問されてしまう
現状把握(計測)→解析→手動→自動
いきなり自動から
故障モード→故障していない
ベースライン計測が行われていない
計測データと熟練エンジニアの保全実施タイミングの比較調査を推奨
■製造現場におけるAIXIoT導入と利活用
・IT業界から見た時代の理解
大容量分析 IoT
既存の
マイニング・BI 超リアルタイム
通信はやくなった
・IoTによる価値創造プロセス
→まずは集めろになってしまった
Analyzing Engine
データ:扱いきれない
入れると何か出てくる・・・エンジン
知識創造プロセスの変化
新たな社会価値創造の機械
産業構造の変革・業界再編
→新しい仕事の創造
・AIとIoTとビッグデータ
IoT→ビッグデータ活用→IoT
AI
・人工知能(AI)技術
人間の知的活動をコンピューター化した技術
AIはなんでもできる??かしこくなる??
・産業保安に関する国の動き(高圧ガス保安、電力保安)
・AIにおける重要な要素
当たりやすさXわかりやすさ
なぜ
最後に精度の維持
→予測精度は低下:チューニングをだれがするか
現場の人:自分でできる(数学がわからなくても)
・扱うデータ;必要とするデータ
データの質
統計解析 Deep Learning
機械学習
データの量
教師ありの機械学習:異常データがないときがこまる
機械学習:答えもそこそこ→AIと人間の協調
2.生産設備/
安全運転
コスト低減
競争力
ノウハウの活用(継承)
3.高度化
ソリューションの実現を支えるNECのAI技術群
WISE
インバリアント分析
ラピッド機械学習(ブラックボックス)
4.事例
射出生成機:エッジで処理
燃焼器拝観欠損によるGTトリップ
・AIの活用による「製造業の高度化」
チップの中で
エッジ
■パネルディスカッション
・SOMPO デジタル ラボ
動画
新しいサービスを作る
・データは素材、AIは道具に過ぎない
IoT:あつめてくるところ
・重要の判断、勘所
→どかんとおくって、どかんと処理
→実際には帯域で送れない
すぐに反応しないといけない場合
選び方→どういうふうに故障するか?
ド素人がみてもわからない?
そう
エッジコンピューティング
→脊髄反射
計測器内で高度な演算してしまう
・AI:知的活動→「学んで」判断する
精密診断→どこにあるかわかる
IoT:データをどう取ってほしい
→ノイズ。載ってるとわかるデータ
やりすぎても困る
サンプリング・精度
動画像と振動データ
・分析する人は、どこにいるべき
分析
プロジェクトマネジメント
コーディネーター:
コンサルよりも上位
つなぐ役割
→飲み会の幹事
コミュニケーション上の問題:人間力
ペアを組む
仲介者・営業を入れる
・成功するポイント・失敗するポイント
現場が入ってきたとき
トップからのリクエスト・人を減らせ:AI入れるからお前首
→拒否られる
→新しい仕事を作る
業界を超えたコラボレーション
センサーのプロ、計測や、
現場との理解
熟練:とけこむ・飲んで何ぼ
クラウド:セキュリティポリシー
データサイエンティスト協会 セミナー2017 第2回
に行ってきた!ので内容メモメモ
■おしらせ
・Data Science Awardについて
■会場について
・内田洋行 ゆびきたすきょうそうひろば きゃんばす
築46年のビルだけど、リノベーションした
■基礎から学ぶ!
インダストリアルIoTの実現に必須の
センサ計測とエッジコンピューティング
・会社紹介
ラボビュー
一社だけでは実現できないインダストリアルIoT
NIは計測制御装置のプロフェッショナル
高い接続性
産業界での協業事例 IIC TestBed
・予知保全の動向と課題
インダストリアルIoT
コンシューマーIoT
予知保全への期待が高い
モニタリングには2種類あり、目的が異なる
プロセスモニタリング:プラントマネジメント
生産設備のモニタリング:予知保全
・設備不具合の大半は回転機械の振動問題
モーターの故障モード
ベアリング、ステーター
各種センサーを用いた予知保全
加速度(振動)センサー
・課題
業界を超えた協力体制の必要性
センサー計測時の課題
・莫大な量のデータを処理しきれない計測器とクラウド
激増するBigData
→センサーから取得するデータ
→アナログデータ:BigAnalogData
AEセンサー:17Mバイト/秒
赤外線:18MB/秒
→ネットワークのトラフィックが耐えられない
レスポンスが間に合わない
・エッジコンピューティングによる重要データの抽出がカギとなる
1.莫大なデータを演算処理し、意味ある情報に変換
2.データ管理
周波数分析・ピークToピーク
・産業向けのデータサイエンティストが
特徴抽出を計測装置内で行い、データ量を絞る
センサー 計測 特徴注抽出 特徴量 特徴選択・次元削減
AR機能で保全
スマートポンプデモにおけるエッジコンピューティングの例
→必要最低限のセンサーからとってくる
人間じゃできないようなもの
・OTやとして困っていること
お客様は計測はこれから。しかし機械学習について質問されてしまう
現状把握(計測)→解析→手動→自動
いきなり自動から
故障モード→故障していない
ベースライン計測が行われていない
計測データと熟練エンジニアの保全実施タイミングの比較調査を推奨
■製造現場におけるAIXIoT導入と利活用
・IT業界から見た時代の理解
大容量分析 IoT
既存の
マイニング・BI 超リアルタイム
通信はやくなった
・IoTによる価値創造プロセス
→まずは集めろになってしまった
Analyzing Engine
データ:扱いきれない
入れると何か出てくる・・・エンジン
知識創造プロセスの変化
新たな社会価値創造の機械
産業構造の変革・業界再編
→新しい仕事の創造
・AIとIoTとビッグデータ
IoT→ビッグデータ活用→IoT
AI
・人工知能(AI)技術
人間の知的活動をコンピューター化した技術
AIはなんでもできる??かしこくなる??
・産業保安に関する国の動き(高圧ガス保安、電力保安)
・AIにおける重要な要素
当たりやすさXわかりやすさ
なぜ
最後に精度の維持
→予測精度は低下:チューニングをだれがするか
現場の人:自分でできる(数学がわからなくても)
・扱うデータ;必要とするデータ
データの質
統計解析 Deep Learning
機械学習
データの量
教師ありの機械学習:異常データがないときがこまる
機械学習:答えもそこそこ→AIと人間の協調
2.生産設備/
安全運転
コスト低減
競争力
ノウハウの活用(継承)
3.高度化
ソリューションの実現を支えるNECのAI技術群
WISE
インバリアント分析
ラピッド機械学習(ブラックボックス)
4.事例
射出生成機:エッジで処理
燃焼器拝観欠損によるGTトリップ
・AIの活用による「製造業の高度化」
チップの中で
エッジ
■パネルディスカッション
・SOMPO デジタル ラボ
動画
新しいサービスを作る
・データは素材、AIは道具に過ぎない
IoT:あつめてくるところ
・重要の判断、勘所
→どかんとおくって、どかんと処理
→実際には帯域で送れない
すぐに反応しないといけない場合
選び方→どういうふうに故障するか?
ド素人がみてもわからない?
そう
エッジコンピューティング
→脊髄反射
計測器内で高度な演算してしまう
・AI:知的活動→「学んで」判断する
精密診断→どこにあるかわかる
IoT:データをどう取ってほしい
→ノイズ。載ってるとわかるデータ
やりすぎても困る
サンプリング・精度
動画像と振動データ
・分析する人は、どこにいるべき
分析
プロジェクトマネジメント
コーディネーター:
コンサルよりも上位
つなぐ役割
→飲み会の幹事
コミュニケーション上の問題:人間力
ペアを組む
仲介者・営業を入れる
・成功するポイント・失敗するポイント
現場が入ってきたとき
トップからのリクエスト・人を減らせ:AI入れるからお前首
→拒否られる
→新しい仕事を作る
業界を超えたコラボレーション
センサーのプロ、計測や、
現場との理解
熟練:とけこむ・飲んで何ぼ
クラウド:セキュリティポリシー
むかし、ROMと呼ばれていたような気が・・・
そんな言い方すると、時代遅れか・・・
SNSを見るだけで発信しない女性たち セルフブランディングよりも日常の情報収集が目的?
https://itlife.oshiete.goo.ne.jp/article/3353
そんな言い方すると、時代遅れか・・・
SNSを見るだけで発信しない女性たち セルフブランディングよりも日常の情報収集が目的?
https://itlife.oshiete.goo.ne.jp/article/3353
で利用できる(カメラが8台までなら)って、知ってました?奥さん・・
※ビデオマネジメントシステム(VMS):監視カメラなどの操作・保存・
監視などを行うシステム
で、さらに、無料でSDKがついているので、顔認識なんかも
がんばれば出来ちゃうかもしれない・・・無償で・・・
あ~、通じていないね。順を追って説明しよう・・
上述のように、「ビデオマネジメントシステム」(VMS)要するに監視カメラ
システム等というのがあるわけだ。
ここの有名どころは、マイルストーンシステム
Milestone SystemsがVMS世界ランキングで1位をシェア
http://prw.kyodonews.jp/opn/release/201306062376/
のXProtect。
そして、日本では、キャノン・マーケティング・ジャパン
(キャノンMJ)が、XProtectを売っている
キヤノンマーケティングジャパンがVMS※1市場に本格参入
マイルストーンシステムズ社※2と販売契約を締結
http://cweb.canon.jp/newsrelease/2016-07/pr-milestonesysytems.html
そしてさらに、NECが、キャノンマーケティングジャパン
と協業して、VMSのアライアンス(顔認証とかするの)を
出している
キヤノンMJとNEC、ネットワークカメラのVMS※1領域で協業
顔認証システムが組み込み可能なビデオマネジメントシステムを発売
http://jpn.nec.com/press/201611/20161129_01.html
ここまでは、understand?
で、このビデオマネジメントシステムなんだけど、
8台までは、無償版っていうのがあるって、知ってました?
さっきいったとおり、Milestone Systemが出していて、キャノンMJが販売しているのは
XProtectっていう製品なんだけど、カメラ8台まで(他制限なし)の製品が
XProtect Essential+っていって、それは
https://www.milestonesys.com/solutions/platform/try-our-software/
から、ダウンロード画面にいける(左側。右側は30日間のトライアル)
で、これで「ビデオマネジメントシステム」はGetできたんだけど、
プログラムで操作したい。その場合は、SDK(MIP SDK) があって
Milestone Integration Platform Software Development Kit
https://www.milestonesys.com/community/developer-tools/sdk/
のページにいくと、Getできる。
そこ、スクロールして、
「MIP SDK works on our free VMS product」は、
上述のXProtect Essential+をダウンロードするとき
つぎのは、トレーニングなので、とりあえずおいとく
そのつぎの「MIP SDK Getting Started Guide」
は始めるときのドキュメント(PDF)。とりあえずみとく
SDKはそのつぎ
「Download the MIP SDK and sign up for Developer Update」
をクリックしてダウンロード。
インストールする前にVisual Studio 2013ないし2015が入っているといいみたい。
勝手になんか、その中に入れてくれて、終わると、MIP用のプログラムを
かけるようにしてくれる。
(ドキュメントは、スタートボタンから「すべてのプログラム」を表示させ、
Milestoneを見ると、中にある)。
言語はC#またはC++らしい。
OpenCVもC#に対応しているから、いろいろ、なにか、ただで、できそうですね!
・・・って、カメラは、ついてない(^^;)
※ビデオマネジメントシステム(VMS):監視カメラなどの操作・保存・
監視などを行うシステム
で、さらに、無料でSDKがついているので、顔認識なんかも
がんばれば出来ちゃうかもしれない・・・無償で・・・
あ~、通じていないね。順を追って説明しよう・・
上述のように、「ビデオマネジメントシステム」(VMS)要するに監視カメラ
システム等というのがあるわけだ。
ここの有名どころは、マイルストーンシステム
Milestone SystemsがVMS世界ランキングで1位をシェア
http://prw.kyodonews.jp/opn/release/201306062376/
のXProtect。
そして、日本では、キャノン・マーケティング・ジャパン
(キャノンMJ)が、XProtectを売っている
キヤノンマーケティングジャパンがVMS※1市場に本格参入
マイルストーンシステムズ社※2と販売契約を締結
http://cweb.canon.jp/newsrelease/2016-07/pr-milestonesysytems.html
そしてさらに、NECが、キャノンマーケティングジャパン
と協業して、VMSのアライアンス(顔認証とかするの)を
出している
キヤノンMJとNEC、ネットワークカメラのVMS※1領域で協業
顔認証システムが組み込み可能なビデオマネジメントシステムを発売
http://jpn.nec.com/press/201611/20161129_01.html
ここまでは、understand?
で、このビデオマネジメントシステムなんだけど、
8台までは、無償版っていうのがあるって、知ってました?
さっきいったとおり、Milestone Systemが出していて、キャノンMJが販売しているのは
XProtectっていう製品なんだけど、カメラ8台まで(他制限なし)の製品が
XProtect Essential+っていって、それは
https://www.milestonesys.com/solutions/platform/try-our-software/
から、ダウンロード画面にいける(左側。右側は30日間のトライアル)
で、これで「ビデオマネジメントシステム」はGetできたんだけど、
プログラムで操作したい。その場合は、SDK(MIP SDK) があって
Milestone Integration Platform Software Development Kit
https://www.milestonesys.com/community/developer-tools/sdk/
のページにいくと、Getできる。
そこ、スクロールして、
「MIP SDK works on our free VMS product」は、
上述のXProtect Essential+をダウンロードするとき
つぎのは、トレーニングなので、とりあえずおいとく
そのつぎの「MIP SDK Getting Started Guide」
は始めるときのドキュメント(PDF)。とりあえずみとく
SDKはそのつぎ
「Download the MIP SDK and sign up for Developer Update」
をクリックしてダウンロード。
インストールする前にVisual Studio 2013ないし2015が入っているといいみたい。
勝手になんか、その中に入れてくれて、終わると、MIP用のプログラムを
かけるようにしてくれる。
(ドキュメントは、スタートボタンから「すべてのプログラム」を表示させ、
Milestoneを見ると、中にある)。
言語はC#またはC++らしい。
OpenCVもC#に対応しているから、いろいろ、なにか、ただで、できそうですね!
・・・って、カメラは、ついてない(^^;)