コンテスト概要(まずはゴールと制約を整理)
要素 | 内容 |
---|---|
主催 / 場所 | OpenAI × Kaggle(Kaggle 初のハッカソン枠) |
課題 | 衛星画像+LIDAR からアマゾン熱帯雨林に眠る未発見遺跡を自動検出 |
〆切 | 2025-06-29 23:59 UTC(日本時間 6/30 午前) www.kaggle.com |
賞金 | $250 k + OpenAI クレジット |
使用必須モデル | GPT-4.1 / o3 / o4-mini(いずれかを “核心で” 使うことが審査項目) twitter.com |
形式 | ハッカソン枠(メダルなし)・上位5チームを審査員が「技術+考古学的妥当性」で最終レビュー |
◎ 評価指標(推定)
公開 Notebook 断片・説明文から、mAP@IoU0.5 / F1 / IoU のいずれかで“遺跡マスク or バウンディングボックス”を採点。提出は GeoJSON/CSV。
↳ 想定が外れても“可変後処理”が効く設計なら慌てずに済む。
6 週間で優勝を狙うロードマップ
🗓 1. スケジュール逆算
期間 | マイルストーン |
---|---|
5/16–5/23 | 🔍データ EDA・基盤整備(LIDAR 点群→DTM/DSM、衛星オルソ画像生成) |
5/24–6/6 | 🚀Baseline → 1st LBアップ ・マルチモーダル基礎モデル (SAM + PointNeXt) ・Cross-val フレーム完成 |
6/7–6/14 | 🧠自己教師あり + Pseudo-Label 拡張 ・Masked Autoencoder (MAE) ・GPT-4.1 による自動異常領域アノテーション |
6/15–6/22 | 🏗 Ensemble & 後処理強化 ・Terrain-aware Morphology ・Conditional Random Field |
6/23–6/28 | ✍️最終モデル凍結・資料作成(GPT で図表→LaTeX) |
6/29 | ✅ 提出&ビデオデモ収録 |
🛰 2. データ前処理(勝敗が分かれるパート)
ステップ | Tips |
---|---|
(a) 同期位置合わせ | 衛星オルソ × LIDAR DTM を Cloud-Optimized GeoTIFF (COG) に揃え、GDAL warp で re-project。 |
(b) 植生除去 | ・点群を canopy/ground クラスに分離 (PDAL – smr), ・NDVI でマスク ⇒ 地表を際立たせる。 |
(c) タイル化 | 512² or 768² ピクセル・オーバーラップ 64 px (メモリ節約のため半分解像度版も作り multi-scale 学習へ)。 |
🤖 3. モデル設計:マルチモーダル・パイプライン
scss
┌───衛星(RGB/近赤外)───┐ │ Vision Transformer │ └─────────────▲────────┘ │ concat (Cross-Attention) ┌───LIDAR(DTM/DSM/CHM)──┐ │ PointNeXt + 1×1 conv │ └─────────────┴────────┘ ↓ Multi-Modal Transformer Decoder ↓ Mask Box Score
要素 | 実装ポイント |
---|---|
バックボーン | ◇ 衛星: ViT-Large (Imagenet-22k 事前学習) ◇ 地形: PointNeXt-XL (点群) |
Fusion | Cross-Attention / FiLM で早期融合。 |
Loss | Dice + Focal (マスク) / GIoU (Box) の複合。 |
推論後 | DBSCAN で小島マージ→Shapely でポリゴン平滑化。 |
🔑 4. “GPT 活用必須” を武器にする 4 つのネタ
-
Auto-EDA & Notebook 生成
gpt-4o
に「LIDAR .las・GeoTIFF を読み込み、点群 → DTM 可視化コードを書いて」とプロンプト。
↳ 時短 & 提案書に “AI プログラミング” 実績を明示。 -
半教師ありアノテーション
-
未ラベル領域を SAM でマスク提案 → GPT-4.1 に “盛り上がった矩形パターン?” と自然言語判定させ pseudo-positive を獲得。
-
考古学知識の埋め込み検索
-
過去論文 300 本を embeddings (=o3) でベクトルDB に。
-
モデルが信頼度低い検出をしたら
RAG
で「この地形は地上絵か?」→説明付きフィルタリング。 -
レポート自動生成
-
最終提出の 2-page tech-card を GPT-4.1 + Mermaid で自動生成 → PDF。
🏆 5. スコアを伸ばす “Kaggle お作法”
テク | 説明 |
---|---|
CV Leak 防止 | タイル間で同一遺跡が train/test に跨がないよう group-k-fold (GEOHASH を GroupID) |
Ensemble | – モデル多様性重視: ① HyperMixing ViT, ② SwinV2, ③ EfficientNet-V2-m Weighted Box Fusion (WBF) で統合。 |
LB 過学習対策 | Private LB 50% hidden ⇒ 1 → 4 seeds ×5-fold を外部 val として保持。 |
推論時間制限 | Notebook 上限 30 min なら ・推論時 ½解像度 & Test-Time Aug 3 種 に抑制 ・重い LIDAR 処理は Pre-computed parquet に。 |
⚔ チーム戦略
役割 | 必要スキル |
---|---|
Remote-Sensing Lead | GDAL / PDAL / 地形解析 |
ML Engineer ×2 | PyTorch / TorchGeo / Lightning |
Prompt Engineer | GPT-4 系 API ワークフロー・RAG |
Archaeology Advisor (外部協力でも可) | 地形の知識・現地論文リファレンス |
Slack + Notion → 進捗管理。毎晩 23 JST にモデル性能を自動集計し、ベストを slack 通知(wandb webhook)。
まとめ
- 前処理とマルチモーダル融合 が技術差を生む。
- GPT シリーズを“モデル内部”に組み込むと審査員ウケ抜群。
- スケジュールは 6 週間。最終 1 週間はバグ潰しと説明資料に全振り。
これで「$250k🏆」が射程に入ります。
気になる点(データ取得・チーム探し etc.)があれば教えてください—さらに深掘りします!Sources