こちらのリンクからお申し込みください:(スペースを削除してください)
概要
SpeechifyのAIチームのデータ部門を担当する人材を募集しています。このポジションは、モデルトレーニング運用を支えるデータ収集のあらゆる側面を担当します。インフラ、エンジニアリング、研究を緊密に統合することで、ペタバイト規模の高品質データセットを低コストで構築することが可能です。スキルの高いソフトウェアエンジニアを募集しています。
何をするか
- オーディオデータの新しいソースを積極的に探し、それを取り込みパイプラインに取り込む
- 現在 GCP 上で実行され、Terraform で管理されている取り込みパイプラインのクラウド インフラストラクチャを運用および拡張します。
- 当社の科学者と緊密に協力してコスト/スループット/品質の限界を変え、より大規模かつ低コストでより豊富なデータを提供し、次世代モデルを強化します。
- AI チームおよび Speechify リーダーシップの他のメンバーと協力して、Speechify の次世代の消費者向けおよびエンタープライズ向け製品を強化する AI Teams データセット ロードマップを作成します。
理想的な候補者は
- コンピュータサイエンスまたは関連分野の学士号/修士号/博士号。
- ソフトウェア開発の業界経験 5 年以上。
- Linux 環境での bash/Python スクリプトの熟練度
- Docker および Infrastructure-as-Code の概念に精通し、少なくとも 1 つの大手クラウド プロバイダー (GCP を使用) での専門的な経験があること
- ウェブクローラー、大規模データ処理ワークフローの経験があれば尚可
- 複数のタスクを処理し、変化する優先順位に適応する能力。
- 文章と口頭の両方で優れたコミュニケーションスキル。