[BlueLeaf1336]> PROBLEMS> MizuhoGetter>

MizuhoGetter > HTMLソースの解析(3)

historyTOP

2004/11/12:作成
2004/11/13:更新

2004/11/12TOP

前回の、ミニロト過去分とロト6過去分は何とかいけたようなので、NUMBERSの過去分を考えます。

loto0001.html
(略)
回別
第1201回
第1202回
第1203回
第1204回
第1205回
抽せん日
H15.8.8
H15.8.11
H15.8.13
H15.8.15
H15.8.18
NUMBERS3
抽せん数字
957
459
989
820
766
NUMBERS4
抽せん数字
9572
3718
3238
1696
5878
(略)

こんな感じです。後はこれのくり返しです。次のようにやればよさそうです。

  1. 「回別」を見つける。1行進める。
  2. 回情報を取り出す。1行進める。5回くり返す。※ここは2セット作成
  3. (「抽せん日」の行にいるはずなので)1行進める。
  4. 抽せん日情報を取り出す。1行進める。5回くり返す。※ここは2セット作成
  5. (「NUMBERS3」の行にいるはずなので)1行進める。
  6. (「抽せん数字」の行にいるはずなので)1行進める。
  7. 抽せん数字情報を取り出す。1行進める。5回くり返す。
  8. (「NUMBERS4」の行にいるはずなので)1行進める。
  9. (「抽せん数字」の行にいるはずなので)1行進める。
  10. 抽せん数字情報を取り出す。1行進める。5回くり返す。

前提にしているものが多すぎる気がしますが...そこは割り切っていくしかないかと。って、いきなり駄目でした。上の方法は「5件連続してあって欲しい」という姿勢ですが、データの最後が2件しかないファイル「num1201.html」がありました。もちろん、ヘンなことになります。しかも、日付をコマシな形に変換しているので、変換エラーが起きたりして。

ちゃんと「抽せん日」とか「NUMBERS3」とかも判定しないと駄目な感じです。

2004/11/13TOP

と言うわけで、横着せず(でも結局前提事項が多いですが)何回分のデータがかかれているかを判定しながら読み込むようにしました。

ここまでで、MINI LOTO・LOTO6・NUMBERS3・NUMBERS4の過去データについては取り出せるようになりました。改めて書いておくと、「過去データは取り出し易いフォーマットで書かれたデータ」「最近データは取り出しにくいフォーマットで書かれたデータ」となっています。

画面は変更がないので、ファイルだけリンクしておきます。

20041113MizuhoGetter.zip(203,838bytes)※ソースコードと実行ファイル。

r_loto0001.txt(2,789bytes)※MINI LOTO 抽選番号取り出し結果(先頭ファイルのみ)
r_loto60001.txt(2,738bytes)※LOTO6 抽選番号取り出し結果(先頭ファイルのみ)
r_num0001.txt(3,630bytes)※NUMBERS3/NUMBES4 抽選番号取り出し結果(先頭ファイルのみ)

あ、こういったプログラムでありがちな、生データと自動生成データを目視で比較する、という作業は「やっていません」のでご注意ください。

後は、もちろん最近のデータの取り出しも残っているんですが、インターフェースを少し変更したいところです。それに、最終結果を適当に分割(NUMBERS3・NUMBERS4)・統合(種類ごとに1つにまとめる)したいところです。そういう見た目も適当に挟まないと飽きそうです。

EOFTOP