今、
Java SE 9/EE 8リリースイベント 兼 JavaOne 2017 報告会 @ 東京
https://jjug.doorkeeper.jp/events/66256
に行っていて、話聞いてる最中だけど、大きな話なので、ここでメモメモ
(上記の件は後半)
■JavaOne2017 Overview & announcements
・JavaOne2017 イベント的には、ほぼほぼ1週間
Javaキーノート:ゲストスピーカーが出てきて中核の話
デベロッパーキーノート:クラウド
コミュニティーキーノート:Javaチャンピオンとたのしくすごす
・まーくきゃべっじ キーノートしきっていた
R&Dのトップ
じょーじさーぶ
まーく:機嫌よかった。(きょねんぴりぴり)9出たので
ステージ 4000人くらい入るホールで
SE9、今後のプロジェクト
JavaEE
チーフアーキテクトコメント
くーばねーてぃすの人のスピーチ
・今年のメッセージ
より、速度を上げていこう:進化を早く
Core Foundation
Javaチャンピオンふえてる
コントリビューションも増えている OpenJDK
現在の状況:世界で一番使われている。1200万人のでべろぱー380億のVM
くらうどだけでも210億のVM
これからの方向性
オープン
進化の加速(evolving)
にんぶる(軽量化)
JavaEE
8のリリース
オープンで
にんぶる
→Eclipseへの移行(Eclipse Enterprise for Java)
JavaSE
9リリース
より早いタイミングで→OpenJDKの位置づけ
・JDKリリースモデルの変更
JDK9
9月リリース
7のときにcoin,Lambda,Jigsawはあった
→実際には一部
→段階を踏んで、9にはいった。
・従来のリリースモデル
OpenJDK:ソースコード提供、OracleJDKと技術的な差
機能リリース 2年に1度のリリースが目標
→まもれたためしない:だいじょうぶなの?
Oracle JDK前後のバージョン1年間のダブりがある
セキュリティパッチ3か月
・新しいリリースモデル
OracleJDKとOpenJDKの技術的な差分なくなる
6か月に1回にリリース:固定
バージョンの表記;来年の3月から18.3、18.9のように
リリースノート、ドキュメントで新しい機能、削除される機能
OpenJDKのバイナリ配布 無償配布の場合
→GPL
・長期サポート 2018年9月から開始
18.9から
更新リリース 3か月ごと
OpenJDK,OracleJDKとも、機能更新はいらない(セキュリティパッチ)
・Oracle JDKの無償利用
今は可能だが、将来辞める→評価、開発の利用はできるが、
ただで、今まで通り利用したいなら、OpenJDKつかってね!
・ソースコードの管理モデル
OpenJDK、OracleJDKの2つ
→新しいモデル、1本のソースコードへ
・JavaSE18.3のスケジュール
3月20日のGA、
2月22日のファイナルキャンディテートにはアーリーアクセスでる
・OpenJDKバイナリダウンロード始まっている
・公式アップデートの終了(無償でアップデート)
8 18年9月終了
9 18年3月終了
18.3 18年9月終了
・商用サポート
プレミアポート8、9もあるけど。。
エクステンデッドサポート 8はあるけど、9はない
・お知らせ JavaSE9日本語ドキュメント公開
Java SE 9/EE 8リリースイベント 兼 JavaOne 2017 報告会 @ 東京
https://jjug.doorkeeper.jp/events/66256
に行っていて、話聞いてる最中だけど、大きな話なので、ここでメモメモ
(上記の件は後半)
■JavaOne2017 Overview & announcements
・JavaOne2017 イベント的には、ほぼほぼ1週間
Javaキーノート:ゲストスピーカーが出てきて中核の話
デベロッパーキーノート:クラウド
コミュニティーキーノート:Javaチャンピオンとたのしくすごす
・まーくきゃべっじ キーノートしきっていた
R&Dのトップ
じょーじさーぶ
まーく:機嫌よかった。(きょねんぴりぴり)9出たので
ステージ 4000人くらい入るホールで
SE9、今後のプロジェクト
JavaEE
チーフアーキテクトコメント
くーばねーてぃすの人のスピーチ
・今年のメッセージ
より、速度を上げていこう:進化を早く
Core Foundation
Javaチャンピオンふえてる
コントリビューションも増えている OpenJDK
現在の状況:世界で一番使われている。1200万人のでべろぱー380億のVM
くらうどだけでも210億のVM
これからの方向性
オープン
進化の加速(evolving)
にんぶる(軽量化)
JavaEE
8のリリース
オープンで
にんぶる
→Eclipseへの移行(Eclipse Enterprise for Java)
JavaSE
9リリース
より早いタイミングで→OpenJDKの位置づけ
・JDKリリースモデルの変更
JDK9
9月リリース
7のときにcoin,Lambda,Jigsawはあった
→実際には一部
→段階を踏んで、9にはいった。
・従来のリリースモデル
OpenJDK:ソースコード提供、OracleJDKと技術的な差
機能リリース 2年に1度のリリースが目標
→まもれたためしない:だいじょうぶなの?
Oracle JDK前後のバージョン1年間のダブりがある
セキュリティパッチ3か月
・新しいリリースモデル
OracleJDKとOpenJDKの技術的な差分なくなる
6か月に1回にリリース:固定
バージョンの表記;来年の3月から18.3、18.9のように
リリースノート、ドキュメントで新しい機能、削除される機能
OpenJDKのバイナリ配布 無償配布の場合
→GPL
・長期サポート 2018年9月から開始
18.9から
更新リリース 3か月ごと
OpenJDK,OracleJDKとも、機能更新はいらない(セキュリティパッチ)
・Oracle JDKの無償利用
今は可能だが、将来辞める→評価、開発の利用はできるが、
ただで、今まで通り利用したいなら、OpenJDKつかってね!
・ソースコードの管理モデル
OpenJDK、OracleJDKの2つ
→新しいモデル、1本のソースコードへ
・JavaSE18.3のスケジュール
3月20日のGA、
2月22日のファイナルキャンディテートにはアーリーアクセスでる
・OpenJDKバイナリダウンロード始まっている
・公式アップデートの終了(無償でアップデート)
8 18年9月終了
9 18年3月終了
18.3 18年9月終了
・商用サポート
プレミアポート8、9もあるけど。。
エクステンデッドサポート 8はあるけど、9はない
・お知らせ JavaSE9日本語ドキュメント公開
10月20日、
InfoTalk#106 「この記事、AI記者が書きましたー人工知能による文章自動生成の近未来」
に行ってきたので、内容メモメモ
■「この記事、AI記者が書きました―人工知能による文章自動生成の近未来」
1.自己紹介&データセクション紹介
・ビジネスに役に立つか→わからない
成果が出た時点でプレスリリース
・テクノロジーハイプサイクル:日本語版
ソーシャルアナリティクス:ピークだったことが 10年前
→あとに幻滅期
ディープラーニングはピーク
ビッグデータ:最悪期
ソーシャルアナリティクス:ちょっと上がった
・IoTプラットフォームがこれから
・データセクションのお話
技術だけでは延びていかない
視聴者分析にSNS:男女とか Twitter分析
IoTデータ売買市場
ドローンの解析
太陽光パネル
ビッグデータファンド
ソーシャルメディア分析:都知事選挙 年齢層
ソーシャルセンサー
目撃情報を拾ってくる:ディープラーニング
2.「事例」この記事、AI記者が書きました
文章生成:どのようなイメージをもっていますか?
中部経済新聞創刊70周年 人工知能が記事書いた
→過去記事をあつめて
アイドルのTwitter代行
意図を伝えて書かせる
海外事例
AIと人間が役割分担
AI記者の進化が読者を増やし、ニュースルームを効率化する
1つのデータソースでマルチユース
日経のAI記者 10秒でまとめる
・共通する特徴
(1)データから記事生成:データに入っていない記事は書けない
(2)速報に適している
(3)記事を構成する文をパターンで表現できる
Q&A:
著作権は?
IoTデータは誰が買うの?
3.「方法」文章生成はこんな仕組み
文章生成を試してみたことがある人
Sec2Secのチャットボット:意味がない
・ポイント
(1)書きたい内容の文をどのようにAIに生成してもらうか
(2)作成された記事候補の評価
・(1)書きたい内容の文をどのようにAIに生成してもらうか
複数のフォーマット変換
試合数:機械学習によってはデータ不足になる
タグ情報をデータから抽出
1.データ抽出
2.タグ抽出
3.文章の生成
4.記事OUT
マルコフ連鎖
RNN,LSTM
極大部分文字列:「接戦を制した」→ノードにする
最初の単語だけで、書きたい文の内容は指示できない
ワードサラダ
タグを指定したうえで、文章生成
Sec2Secでも、入力にタグ情報を入れる方法ある
タグをベースにする→タグを定義
学習できない場合→人手で定義 定義を書く
起承転結の4つのブロック
→何万通りの中から、どれがいいか選ぶ
(2)作成された記事候補の評価
電通のAIコピーライター「AICO]、その実力はいかに?
実は書くことよりも、記事を評価できることのほうが重要ではないのか?
→GANモデルみたいなの
・まとめ
限定的な分野とテンプレ的な記事であれば、学習や評価に手を書けることによって
AI記者が活躍できる
・Q&A
キャッチコピー、広告は自動生成している
化粧品を買いたい女性の気持ち:60種類しかない
ユーザーにぶつけてみる:会員にメール→15分ぐらいでわかる
→プログラムベースでできる。で、AIにする必要は?
・人間が理解できる文章のパターンは、決まっている
ディープラーニングにする必要はないのでは?
・アテンション
・意味的な間違いをどれくらい指摘できる?
■学校からのアナウンス
・大学院説明会
・次回は11月17日
【所感を追加:Q&Aについて】
・著作権の問題
「著作権法47条の7」を適用しているんだと思う。詳しくは
コラム:機械学習パラダイス(上野達弘)
http://rclip.jp/2017/09/09/201708column/
・キャッチコピー、広告は自動生成している
ルールが見つかれば、ルールベースのほうが早い。
質問者の場合は、化粧品・通販で、ターゲット女性と絞られているので、
場面が少なく、そのためルールが見つけやすい
一般に記事は、女性だけでなく、男性も読み、
それが家庭で読む場合、学校で読む場合、会社で読む場合・・・など、いろいろなケースがある
これらのケースを詳細化し、組み合わせを考えて場面を形成し、
各場面のルールを導こうとすると、組合せ爆発する。
ところが、読者と、読むケースというのは、昨日と今日で、そんなに変わらない。
そこで、そういう詳細化による分析をしないで、
どうも、こういうときに、これが受けるらしいというのがわかれば、
それを使ったほうがいいことになる。これができる技術が機械学習。
InfoTalk#106 「この記事、AI記者が書きましたー人工知能による文章自動生成の近未来」
に行ってきたので、内容メモメモ
■「この記事、AI記者が書きました―人工知能による文章自動生成の近未来」
1.自己紹介&データセクション紹介
・ビジネスに役に立つか→わからない
成果が出た時点でプレスリリース
・テクノロジーハイプサイクル:日本語版
ソーシャルアナリティクス:ピークだったことが 10年前
→あとに幻滅期
ディープラーニングはピーク
ビッグデータ:最悪期
ソーシャルアナリティクス:ちょっと上がった
・IoTプラットフォームがこれから
・データセクションのお話
技術だけでは延びていかない
視聴者分析にSNS:男女とか Twitter分析
IoTデータ売買市場
ドローンの解析
太陽光パネル
ビッグデータファンド
ソーシャルメディア分析:都知事選挙 年齢層
ソーシャルセンサー
目撃情報を拾ってくる:ディープラーニング
2.「事例」この記事、AI記者が書きました
文章生成:どのようなイメージをもっていますか?
中部経済新聞創刊70周年 人工知能が記事書いた
→過去記事をあつめて
アイドルのTwitter代行
意図を伝えて書かせる
海外事例
AIと人間が役割分担
AI記者の進化が読者を増やし、ニュースルームを効率化する
1つのデータソースでマルチユース
日経のAI記者 10秒でまとめる
・共通する特徴
(1)データから記事生成:データに入っていない記事は書けない
(2)速報に適している
(3)記事を構成する文をパターンで表現できる
Q&A:
著作権は?
IoTデータは誰が買うの?
3.「方法」文章生成はこんな仕組み
文章生成を試してみたことがある人
Sec2Secのチャットボット:意味がない
・ポイント
(1)書きたい内容の文をどのようにAIに生成してもらうか
(2)作成された記事候補の評価
・(1)書きたい内容の文をどのようにAIに生成してもらうか
複数のフォーマット変換
試合数:機械学習によってはデータ不足になる
タグ情報をデータから抽出
1.データ抽出
2.タグ抽出
3.文章の生成
4.記事OUT
マルコフ連鎖
RNN,LSTM
極大部分文字列:「接戦を制した」→ノードにする
最初の単語だけで、書きたい文の内容は指示できない
ワードサラダ
タグを指定したうえで、文章生成
Sec2Secでも、入力にタグ情報を入れる方法ある
タグをベースにする→タグを定義
学習できない場合→人手で定義 定義を書く
起承転結の4つのブロック
→何万通りの中から、どれがいいか選ぶ
(2)作成された記事候補の評価
電通のAIコピーライター「AICO]、その実力はいかに?
実は書くことよりも、記事を評価できることのほうが重要ではないのか?
→GANモデルみたいなの
・まとめ
限定的な分野とテンプレ的な記事であれば、学習や評価に手を書けることによって
AI記者が活躍できる
・Q&A
キャッチコピー、広告は自動生成している
化粧品を買いたい女性の気持ち:60種類しかない
ユーザーにぶつけてみる:会員にメール→15分ぐらいでわかる
→プログラムベースでできる。で、AIにする必要は?
・人間が理解できる文章のパターンは、決まっている
ディープラーニングにする必要はないのでは?
・アテンション
・意味的な間違いをどれくらい指摘できる?
■学校からのアナウンス
・大学院説明会
・次回は11月17日
【所感を追加:Q&Aについて】
・著作権の問題
「著作権法47条の7」を適用しているんだと思う。詳しくは
コラム:機械学習パラダイス(上野達弘)
http://rclip.jp/2017/09/09/201708column/
・キャッチコピー、広告は自動生成している
ルールが見つかれば、ルールベースのほうが早い。
質問者の場合は、化粧品・通販で、ターゲット女性と絞られているので、
場面が少なく、そのためルールが見つけやすい
一般に記事は、女性だけでなく、男性も読み、
それが家庭で読む場合、学校で読む場合、会社で読む場合・・・など、いろいろなケースがある
これらのケースを詳細化し、組み合わせを考えて場面を形成し、
各場面のルールを導こうとすると、組合せ爆発する。
ところが、読者と、読むケースというのは、昨日と今日で、そんなに変わらない。
そこで、そういう詳細化による分析をしないで、
どうも、こういうときに、これが受けるらしいというのがわかれば、
それを使ったほうがいいことになる。これができる技術が機械学習。