2007-08-01から1ヶ月間の記事一覧

Oracle Database 11g Release

ついに出た模様。相変わらずJPのサイトには何も書いて無いな。 http://www.oracle.com/features/hp/11g-general-availability.html 現時点でダウンロード可能なのはLinux版のみとなっている。 最初からWindows版も出さないのは珍しい気もする。

大量データ処理、トークンカウント

引き続き効率測定。今度は文字の出現回数を調べる場合。 対象データは前回同様に300万行、600MB程度。 コードはループ内の該当箇所のみ記述。 正規表現 所要時間22.8sec $count = $_ =~ s/ / /g; index 所要時間25.7sec $count = 0; $pos = -1; while(($pos …

一回休み

長く居ても増えるのは柵ばかり。 そろそろ潮時なのかもしれず。

大量データの分割、切り出し処理

スクリプトで大量のデータ処理をしていてsplitが重いと感じたので 色々比較してみた。perlのsplitは正規表現での分割なので、そんなに早くは 無いだろうと思ったが、書き方によっても結構違うようだ。 対象データは300万行、600MB程度。 行単位で読み込んで…