Skip to main content

Tentang VoicePing

VoicePing sedang merevolusikan komunikasi perniagaan global dengan membangunkan Model AI Suara asas melalui teknologi canggih. Ditubuhkan pada 2019, kami telah berkembang untuk melayani 1000+ pelanggan enterprise dengan infrastruktur terjemahan pertuturan terkemuka industri kami. Ketahui Lebih Lanjut:

Pencapaian Syarikat

  • 1000+ pelanggan enterprise berbayar
  • $2.3M USD jumlah pelaburan sebagai SEED
  • Pengiktirafan dari pemecut global (500 Global, Rainmaking APAC, AlchemistX)
Gambaran Keseluruhan Pasukan VoicePing

Pasukan pelbagai kami termasuk pembangun AI elit dari SoftBank, Rakuten, IBM, dan banyak lagi


Gambaran Keseluruhan Infrastruktur Teknikal

Tindanan AI Teras

KomponenTeknologi
Pengecaman PertuturanTransformer terlatih tersuai dioptimumkan untuk bahasa Asia
Enjin TerjemahanLLM dilaraskan dengan latihan khusus domain
Teks-ke-PertuturanModel penjanaan audio disintesis semula jadi emosi
Model BahasaModel khusus untuk terminologi perniagaan dan perbendaharaan kata teknikal
Pemprosesan AudioPenstriman audio masa nyata dengan saluran paip DSP tersuai

Tindanan Pembangunan

Frontend:
  • Teras: React, TypeScript, Flutter (iOS, Android)
  • Masa nyata: WebSocket, WebRTC untuk penstriman audio
  • Komponen UI: Ant Design, Flutter
Backend:
  • Utama: Node.js (TypeScript), Python (FastAPI), Golang
  • API: REST
DevOps & Infrastruktur:
  • Platform Awan: AWS, GCP, Azure, VPS, OnPremise
  • CI/CD: GitHub Actions, Azure CodePipeline
Saluran Paip AI/ML:
  • Alat: PyTorch, Hugging Face, Llama, Unsloth, Qwen

Tanggungjawab Teras

Pembangunan Infrastruktur

  • Membina dan menyelenggara saluran paip pemprosesan audio masa nyata
  • Melaksanakan titik akhir API berprestasi tinggi untuk perkhidmatan terjemahan
  • Membangunkan dan mengoptimumkan sambungan WebSocket untuk terjemahan langsung
  • Mencipta dan menyelenggara perkhidmatan mikro berkontena

Integrasi AI

  • Bekerjasama dengan jurutera ML dalam penggunaan model
  • Melaksanakan infrastruktur penyajian model
  • Mengoptimumkan saluran paip inferens untuk latensi rendah
  • Membangunkan sistem pemantauan untuk prestasi model

Penciptaan Model AI

  • Mereka bentuk strategi saluran paip data dan mengumpul data berkualiti tinggi
  • Melaraskan parameter model AI (hiperparameter, seni bina) untuk meningkatkan kecekapan VRAM dan kelajuan inferens
  • Mencipta strategi penilaian model, menganalisis keputusan, dan menentukan hala tuju yang betul
  • Menyelidik model dan kertas OSS terkini untuk menambah baik model semasa
  • Menerbitkan artikel penyelidikan dan menyumbang kepada ekosistem OSS

Pembangunan Aplikasi

  • Membina antara muka web responsif untuk terjemahan masa nyata
  • Melaksanakan keupayaan terjemahan luar talian
  • Mencipta alat pembangun dan SDK
  • Membangunkan papan pemuka dalaman untuk pemantauan sistem

Keperluan Teknikal

Wajib Ada

  • 0.5-3 tahun pengalaman dengan React dan TypeScript (atau keupayaan untuk mencipta prototaip frontend pantas)
  • Beberapa pengalaman dengan Node.js dan Python atau rangka kerja serupa
  • Pemahaman asas prinsip CI/CD
  • Pengalaman dengan platform awan (AWS/GCP/Azure)
  • Minat yang kuat dalam teknologi dan ekosistem AI

Bagus untuk Ada

  • Pemprosesan digital Audio dan Video
  • Pengetahuan tentang penggunaan model ML dan pengoptimuman inferens
  • Latar belakang dalam penyelidikan NLP atau pengecaman pertuturan atau terjemahan
  • Pemahaman tentang pengkomputeran berprestasi tinggi dan pemprosesan data boleh skala

Cabaran Teknikal Semasa

  • Mengoptimumkan pemprosesan audio masa nyata untuk latensi rendah
  • Penciptaan model E2E untuk terjemahan pertuturan emosi
  • Penciptaan model E2E untuk bot ejen suara AI
  • Menskalakan inferens model ML untuk meminimumkan kelajuan inferens dengan tenaga rendah
  • Melaksanakan terjemahan luar talian yang cekap
  • Membina sistem pemantauan yang teguh untuk menyokong infrastruktur kami
  • Membangunkan SDK untuk integrasi pihak ketiga
  • Pengumpulan dan penciptaan data latihan berbilang bahasa berskala besar

Peluang Pertumbuhan

  • Mendalami infrastruktur dan ekosistem ML
  • Mempelajari pemprosesan audio lanjutan
  • Rangka kerja latihan pembelajaran mesin
  • Saluran paip data untuk data latihan model AI
  • Menguasai sistem teragih

Faedah

  • Gaji kompetitif berdasarkan pengalaman: 7,000,000 - 12,000,000
  • Pengaturan kerja fleksibel (hibrid/jarak jauh)
  • Insurans kesihatan
  • Bengkel teknikal tetap

Lokasi

  • Tokyo (utama)
  • Pejabat Singapura (berkembang) - jika anda mempunyai kediaman Singapura
  • Pilihan kerja jarak jauh tersedia (Pada masa ini 85% jarak jauh, 15% pejabat)

Cara Memohon

Hantar ke [email protected]:
  1. Resume/CV dengan projek teknikal
  2. Sila jelaskan bagaimana anda boleh menyumbang dan apa yang anda mahu lakukan
Kami sedang mencari pembangun yang bersemangat untuk membina masa depan AI suara dan teknologi terjemahan masa nyata!