業務内容
▼お任せしたいこと|AI SaaSの心臓部を支えるデータエンジニア
スマサテのプロダクトの心臓部である「データ基盤」の開発・運用を担うポジションです。世の中に散らばる膨大かつ雑多な不動産情報を収集し、誰もが使える「綺麗なデータ」へとクレンジング・構造化していくのがメインミッションです。データサイエンティストの高度な分析や、アプリケーションの高速処理に耐えうる「綺麗で構造化されたデータ」へと継続的に変換・蓄積するため、スケーラブルなデータパイプラインの設計・運用をリードしていただきます。
▼具体的には....
• データ基盤(DWHやデータレイク等)のアーキテクチャの選定、設計、構築
• Web上からの継続的な不動産データ収集(クローリングやスクレイピング)、クレンジングおよび整形プログラムの実装
• バッチ処理やストリーミング処理のデータパイプラインの構築と最適化
• データ品質の担保、インフラ基盤やパイプラインの監視、パフォーマンスチューニング
• アプリチームやデータサイエンティストとの要件定義、データスキーマのすり合わせ
▼開発スタイル
1.難易度やメンバーのスキルに応じて、タスクをアサイン
2.そのメンバーが主体的に設計・開発・テストまでを行ってプルリクエストまで担当
3.
他メンバーがレビュー・動作確認を経てリリース
が基本的な流れになります。
まだ若い会社ですが、次のような文化・スタイルが醸成されてきています。
• 品質第一:リリース前に複数人でテスト。バグ発生時は全員で初動対応します。
• 高速サイクル:週2,3回アップデートをリリースできる体制を構築。
▼開発環境
• 開発言語:Ruby, PHP, Python, JavaScript, Node.js, TypeScript
• フレームワーク:Ruby on Rails, Django, React, Vue.js
• OS:Linux
• DB:MySQL8.x , BigQuery
• インフラ:AWS, GCP
• テスト: Autify, RSpec, Vitest
• CI/CD: CircleCI
• ソースコード管理:GitHub
• ローカル開発環境:Docker
▼最近の技術的取り組み事例
• Autifyを使用してテストの自動化
• AWSCloudWatchを導入し、監視を強化
• ElasticSearchとKibanaでのデータ分析、ログ監視
• Reactを導入することで開発速度を向上
• AwsAmplifyを導入することでスケーラビリティを向上
▼今後計画している技術的取り組み事例
• 現在のモノリシックアーキテクチャーからマイクロサービス化を推進
• Refineを導入することで開発プロセスを改善
• CI/CDパイプラインを構築して、開発とデプロイの効率を高める
• TypeScriptベースのReact/Next.jsへの完全な移行
▼本ポジションの魅力とやりがい
• 【技術基盤への投資】勤務時間の20%を技術的負債の解消や新しい技術の導入に割く制度があり、エンジニア主導で継続的な改善に取り組めます。
• 【ビッグデータとスケーラビリティ】11億レコードを超える膨大な不動産データを扱うマルチDB環境や、マイクロサービス化など、スタートアップならではの技術的チャレンジにあふれています。
• 【エンジニア本位のカルチャー】好きなPC(Mac/Windows/Linuxやスペックも選択可)、エディタ、AIツールを柔軟に導入でき、コアタイムなしのフルフレックスで圧倒的に働きやすい環境です。
• 【顧客志向と手触り感】セールスやPdMとの距離が非常に近く、ユーザーからの生のフィードバックをダイレクトに受け取りながら、本当に価値のあるプロダクト開発にこだわれます。
• 不動産という誰もが関わる巨大な基幹産業の課題をテクノロジーで解決していく、知的好奇心が尽きない面白さがあります。
▼キャリアパス例(ご希望や実績に応じて様々なパスがあります)
• Lead Data Engineer(リードデータエンジニア): スケーラブルなデータパイプラインのアーキテクチャ設計から技術選定までを主導し、データエンジニアリングチームを牽引するエキスパート。
• Data Architect(データアーキテクト): 組織全体のデータ戦略に基づき、11億件超のデータ基盤の統合やデータメッシュ設計、ガバナンス構築を全社横断で主導するポジション。
スマサテのプロダクトの心臓部である「データ基盤」の開発・運用を担うポジションです。世の中に散らばる膨大かつ雑多な不動産情報を収集し、誰もが使える「綺麗なデータ」へとクレンジング・構造化していくのがメインミッションです。データサイエンティストの高度な分析や、アプリケーションの高速処理に耐えうる「綺麗で構造化されたデータ」へと継続的に変換・蓄積するため、スケーラブルなデータパイプラインの設計・運用をリードしていただきます。
▼具体的には....
• データ基盤(DWHやデータレイク等)のアーキテクチャの選定、設計、構築
• Web上からの継続的な不動産データ収集(クローリングやスクレイピング)、クレンジングおよび整形プログラムの実装
• バッチ処理やストリーミング処理のデータパイプラインの構築と最適化
• データ品質の担保、インフラ基盤やパイプラインの監視、パフォーマンスチューニング
• アプリチームやデータサイエンティストとの要件定義、データスキーマのすり合わせ
▼開発スタイル
1.難易度やメンバーのスキルに応じて、タスクをアサイン
2.そのメンバーが主体的に設計・開発・テストまでを行ってプルリクエストまで担当
3.
他メンバーがレビュー・動作確認を経てリリース
が基本的な流れになります。
まだ若い会社ですが、次のような文化・スタイルが醸成されてきています。
• 品質第一:リリース前に複数人でテスト。バグ発生時は全員で初動対応します。
• 高速サイクル:週2,3回アップデートをリリースできる体制を構築。
▼開発環境
• 開発言語:Ruby, PHP, Python, JavaScript, Node.js, TypeScript
• フレームワーク:Ruby on Rails, Django, React, Vue.js
• OS:Linux
• DB:MySQL8.x , BigQuery
• インフラ:AWS, GCP
• テスト: Autify, RSpec, Vitest
• CI/CD: CircleCI
• ソースコード管理:GitHub
• ローカル開発環境:Docker
▼最近の技術的取り組み事例
• Autifyを使用してテストの自動化
• AWSCloudWatchを導入し、監視を強化
• ElasticSearchとKibanaでのデータ分析、ログ監視
• Reactを導入することで開発速度を向上
• AwsAmplifyを導入することでスケーラビリティを向上
▼今後計画している技術的取り組み事例
• 現在のモノリシックアーキテクチャーからマイクロサービス化を推進
• Refineを導入することで開発プロセスを改善
• CI/CDパイプラインを構築して、開発とデプロイの効率を高める
• TypeScriptベースのReact/Next.jsへの完全な移行
▼本ポジションの魅力とやりがい
• 【技術基盤への投資】勤務時間の20%を技術的負債の解消や新しい技術の導入に割く制度があり、エンジニア主導で継続的な改善に取り組めます。
• 【ビッグデータとスケーラビリティ】11億レコードを超える膨大な不動産データを扱うマルチDB環境や、マイクロサービス化など、スタートアップならではの技術的チャレンジにあふれています。
• 【エンジニア本位のカルチャー】好きなPC(Mac/Windows/Linuxやスペックも選択可)、エディタ、AIツールを柔軟に導入でき、コアタイムなしのフルフレックスで圧倒的に働きやすい環境です。
• 【顧客志向と手触り感】セールスやPdMとの距離が非常に近く、ユーザーからの生のフィードバックをダイレクトに受け取りながら、本当に価値のあるプロダクト開発にこだわれます。
• 不動産という誰もが関わる巨大な基幹産業の課題をテクノロジーで解決していく、知的好奇心が尽きない面白さがあります。
▼キャリアパス例(ご希望や実績に応じて様々なパスがあります)
• Lead Data Engineer(リードデータエンジニア): スケーラブルなデータパイプラインのアーキテクチャ設計から技術選定までを主導し、データエンジニアリングチームを牽引するエキスパート。
• Data Architect(データアーキテクト): 組織全体のデータ戦略に基づき、11億件超のデータ基盤の統合やデータメッシュ設計、ガバナンス構築を全社横断で主導するポジション。
※本求人は、株式会社キッカケクリエイションによる職業紹介での求人ご紹介となります。
求める人物像
■必須条件
• Pythonを用いたデータパイプライン(ETL/ELT)またはデータ処理バッチの開発経験(3年以上)
• AWSやGCP等クラウドインフラを利用したデータ基盤(DWH、データレイク等)の構築・運用経験
• SQLを用いた複雑なデータ抽出・集計の実務経験
• RDBMSおよびNoSQLデータベースの設計・運用経験
■求める人物像
• 「綺麗なデータ」を作ることに誇りを持ち、細部の品質にこだわれる方
• データサイエンティストやアプリエンジニアと連携し、チームのアウトプットを最大化することに喜びを感じる方
• レガシーなデータを扱う泥臭い作業もいとわず、技術力でスマートに解決できる方
• ユーザーの気持ちを考え誠実に対応できる方
• 仕事の期限を意識しつつアジャイルな柔軟性もある方
• TRY&ERRORでくじけない方
■歓迎要件
• 大規模データ(数億〜10億レコード超)を扱う処理基盤の最適化経験
• 大規模なWebクローラー/スクレイピングシステムの構築・運用経験
• dbt/Airflow等のオーケストレーションツールを用いた開発・運用経験
• BIツール(Tableau、Metabase等)のデータマート構築・運用経験
• Elasticsearch等を用いた検索システムの構築・チューニング経験
• 生成AI×データ活用の経験(RAG/LLM連携等)
• マイクロサービス化・データメッシュ設計の経験
• データセキュリティやガバナンスに関する知見
• 不動産・金融領域のデータ業務経験
• Pythonを用いたデータパイプライン(ETL/ELT)またはデータ処理バッチの開発経験(3年以上)
• AWSやGCP等クラウドインフラを利用したデータ基盤(DWH、データレイク等)の構築・運用経験
• SQLを用いた複雑なデータ抽出・集計の実務経験
• RDBMSおよびNoSQLデータベースの設計・運用経験
■求める人物像
• 「綺麗なデータ」を作ることに誇りを持ち、細部の品質にこだわれる方
• データサイエンティストやアプリエンジニアと連携し、チームのアウトプットを最大化することに喜びを感じる方
• レガシーなデータを扱う泥臭い作業もいとわず、技術力でスマートに解決できる方
• ユーザーの気持ちを考え誠実に対応できる方
• 仕事の期限を意識しつつアジャイルな柔軟性もある方
• TRY&ERRORでくじけない方
■歓迎要件
• 大規模データ(数億〜10億レコード超)を扱う処理基盤の最適化経験
• 大規模なWebクローラー/スクレイピングシステムの構築・運用経験
• dbt/Airflow等のオーケストレーションツールを用いた開発・運用経験
• BIツール(Tableau、Metabase等)のデータマート構築・運用経験
• Elasticsearch等を用いた検索システムの構築・チューニング経験
• 生成AI×データ活用の経験(RAG/LLM連携等)
• マイクロサービス化・データメッシュ設計の経験
• データセキュリティやガバナンスに関する知見
• 不動産・金融領域のデータ業務経験
募集要項
| 職種 | データエンジニア |
|---|---|
| 雇用形態 | 正社員 |
| 勤務体系 | フレックスタイム制度 |
| 就業時間 | 09:30~18:30 |
| 休日 | 年間休日120日, 土日祝休み,完全週休二日制,有給休暇,年末年始休暇, ● 年次有給休暇(入社時から付与) ● 結婚休暇 |
| 給与 | 年俸:4,000,000円 〜 固定残業:なし グレード1: 400〜600万円 グレード2: 600〜800万円 グレード3: 800〜1,000万円 グレード4: 1,000〜1,500万円 グレード5: 1,500万円〜 ※ 提示金額は、ご経験・スキル、および前職給与を最大限考慮の上、当社規定により決定いたします。 |
| 試用期間 | 試用期間:あり 期間:3ヶ月 条件:本採用時と同様 |
| リモートワーク制度 | ハイブリッドリモート |
| 待遇・福利厚生 | 書籍購入補助制度,リモートワーク制度 |
| 加入保険 | 健康保険あり・労災保険あり・厚生年金あり・雇用保険あり |
| 受動喫煙防止措置 | あり |
| 育児休業取得実績 | あり |
| 就業場所 | 東京都品川区上大崎3-3-1自転車総合ビル 8F |
| 沿線・最寄駅 | ● JR山手線目黒駅徒歩2分 ● 東京メトロ南北線目黒駅徒歩1分 |
| 勤務先名 | スマサテ株式会社 |
| 勤務先ウェブサイトURL | https://sumasate.co.jp/ |
| 選考について | 書類選考 一次選考 二次選考 最終選考 ※必要に応じてカジュアル面談の実施可 ※最終選考は対面での実施となります ※選考回数は候補者によって増減する可能性有 |
| 応募書類等 | 履歴書、職務経歴書 |
| 採用人数 | 1 名 |
紹介会社情報
| 企業名 | 株式会社キッカケクリエイション |
|---|---|
| 業種 | 人材派遣・人材紹介 |
| 代表者名 | 川島 我生斗 |
| 所在地 | 東京都渋谷区桜丘町22番14号 N.E.Sビル N棟3階 |
| 事業内容 | 有料職業紹介・派遣事業 有料職業紹介許可番号:13-ユ-312698 労働者派遣許可番号:派13-316232 |
| 電話番号 | 090-8226-6875 |

