jq による JSONL データからのデータ抽出の例
$ cat test.jsonl {"abc": "abc", "def": "def"} {"abc": "ghi", "def", "jkl"}
指定項目を出力
$ cat test.jsonl | jq -c '{abc: .abc}' {"abc":"abc"} {"abc":"ghi"}
-c を指定しない場合は以下のような出力となります。
{ "abc": "abc" } { "abc": "ghi" }
jq による JSONL データからのデータ抽出の例
$ cat test.jsonl {"abc": "abc", "def": "def"} {"abc": "ghi", "def", "jkl"}
$ cat test.jsonl | jq -c '{abc: .abc}' {"abc":"abc"} {"abc":"ghi"}
-c を指定しない場合は以下のような出力となります。
{ "abc": "abc" } { "abc": "ghi" }
Vertex AI のマルチモーダルエンベディングの実行例のメモ。
概要
外部接続の IAM に対して以下の権限を設定。
$ gsutil cp *.jpg gs://{バケット}/{パス}/
以下を実行。
CREATE OR REPLACE EXTERNAL TABLE `{プロジェク}.{データセット}.{テーブル}` WITH CONNECTION `{リージョン}.{接続ID}` OPTIONS ( object_metadata = 'SIMPLE', uris = ['gs://{バケット}/{パス}/*.jpg'] );
select regexp_extract(uri, '/([0-9]+).jpg$') as id , ml_generate_embedding_result as image_vecctor from ml.generate_embedding( model {データセット}.{テーブル}, table {データセット}.{オブジェクトテーブル}, struct( true as flatten_json_output, 512 as output_dimensionality ) ) ;
実行中のプロセスをバックグラウンドで実行する方法のメモ。
いま以下を実行している状態です。
$ cat test.txt | python test.py > result.txt
このまま端末を終了すると、プロセスも終了してしまいます。
そのため、以下でバックグラウンドで実行します。
ctrl + z でプロセスを一時停止します。
$ bg
$ disown -h %1
これで端末を終了しても、バックグラウンドでプロセスが実行され続けます。