データプラットフォームソフトウェアエンジニア・Enterprise AI
Product & Technology Cloud & AI
東京都中央区
hybrid
チームについて
エンタープライズAIチームは、トヨタおよびその関連会社に強力なAIイノベーションプラットフォームを提供することに専念しています。我々の使命は、トヨタグループ内で自動運転などの画期的なプロジェクトを推進するための包括的なエンドツーエンドの機械学習エコシステムを提供することです。「Woven by Toyota」の標準化された機械学習プラットフォームとして、トレーニングや推論からMLOps(機械学習オペレーション)に至るまで、AI開発のあらゆる側面を効率化し、トヨタの車両の安全性、利便性、自律性を向上させることを目指しています。
このダイナミックな環境の中で、データプラットフォームエンジニアリングチームは重要な役割を果たします。私たちは、トヨタおよびそのパートナーに合わせたスケーラブルでグローバルに分散されたデータ配信ソリューションを設計・実装しています。私たちのチームは、人間支援と自動化されたデータラベリングサービスの両方を開発の最前線に立っており、さまざまなモデル開発やAIソリューションの取り組みを通じて協力的に関与しています。これらの取り組みにより、データがアクセス可能であるだけでなく、実用的であることを保証し、エンタープライズ全体でのイノベーションと効率性を促進しています。
求める人材
バックエンドエンジニアとして、異なる地域に分散している機械学習エンジニアと協力しながら、ラベリング機能の開発を支援していただきます。大規模なデータセットを国を跨がるユーザーに提供します。私たちの目標は、人間や機械によってラベル付けされたデータの取得と配信を変革し、機械学習プロジェクトの世界的な発展を加速させることです。
技術的スキルとコミュニケーションスキルの両方を持っている必要があります。チームの一員として、私たちは互いに開発の質を改善するため、健全で建設的、そして前向きなフィードバックを尊重します。リファクタリング、レガシーコードの書き直し、プロファイリング、コードスタイル、コードレビューなどを促進します。
業務内容
- 機能の設計から導入までを一貫して実施します
- 複雑な問題を解決し、最先端のソリューションを提供する
- チームリードやソフトウェアエンジニアと協力して、ラベリング機能群のバックエンドを開発し、製品の機能要件と非機能要件を確実に満たします
- 複数の機械学習トレーニングデータフォーマットをサポートし、リアルタイムでの変換を可能にします
- データアノテーションエンジニアリングチームが所有するデータセットを用いて、機械学習データ可視化ソリューションなどの複数のデータシンクと統合します
- フロントエンド開発者と密に連携し、APIコントラクトを確立・維持します
- データアノテーションエンジニアリングチームを担当するマネージャーに直接報告します
必須条件
- Python開発の経験が最低4年あり、そのうち2年以上は非同期Pythonプログラミングに専念していること、また、機械学習の基礎的な理解を持っていること
- 大規模なデータセットの取り扱いに精通していること。大量の行やドキュメントを持つデータベースを含み、並行性、分散コンピューティング、Blobストレージの確実な理解を持っていること。
- 複数のメッセージキュー(チャネル)を利用するイベント駆動型アーキテクチャに精通していること
- PostgreSQLやMongoDBなどの主要なRDBMSおよびNoSQLデータベースの知識
- Kubernetesの実務経験
- ハイブリッドワークモデルに従い、週3日オフィスで働く能力
- ビジネスレベルの英語能力
歓迎条件
- オープンソースプロジェクトへの貢献およびオープンソースソフトウェアを分析する能力
- 空間/幾何情報またはベクターデータベースに関する知識
- PyTorchのデータローダーや、2D/3Dベースの機械学習トレーニングデータフォーマットの経験
- 機械学習、特に深層学習に関する理解
- 画像およびポイントクラウド処理技術の知識
- 機械学習や大規模並列コンピューティング環境で一般的に使用されるプログラミング言語の一つ以上に精通していること