Top / 研修 / データビジュアライゼーション / Hive講習
データビジュアライゼーションワークショップ †Hive研修 †
sqLの基礎 †SQLはあるデータの固まりを取り出す一連の手続きです 例えば、 SELECT * FROM nicodata.tags WHERE tag="動画" LIMIT 10 これで、tagデータのなかからタグが動画の情報を取得します。 SELECT smid FROM nicodata.tags WHERE tag="動画" LIMIT 10 こうすればタグが動画のsmidをみる事が出来ます。 もしこれを、プログラムでやったなら? var dataset = open("tagdata","rb"); var smids=new array(); foreach (dataset as data){ if(data.tag=="動画"){ smids.append(data.smid); if (smids.length>10){break;} } } print skids; みたいな複雑な書き方になる。 SQLとは、このような複雑さを隠して、楽にデータを取られるようにしています。 SQLの目的 †目標は、多様なデーセットから、必要とするデータを取り出す事にある。 選択 SELECT * FROM nicodata.video_info WHERE to_date(updated_time) > to_date('2012-01-01 00:00:00') LIMIT 10; 動画投稿日が、2012-01-01以降の物を選択して、10件を上限に表示せよ。 集約 SELECT to_date(update_time),count(*) FROM nicodata.video_info GROUP BY to_date(update_time) 動画投稿日ごとに、集約して、投稿数を表示せよ。 SQLのサンプル集 †
調べてみよう †
サンプルSQL ] [#i4e89497] †
|