Tentang VoicePing
VoicePing sedang merevolusikan komunikasi perniagaan global dengan membangunkan Model AI Suara asas melalui teknologi canggih. Ditubuhkan pada 2019, kami telah berkembang untuk melayani 1000+ pelanggan enterprise dengan infrastruktur terjemahan pertuturan terkemuka industri kami. Ketahui Lebih Lanjut:- Produk Kami
- Perjalanan Pembangunan Produk
- Program J-StarX Silicon Valley
- Pandangan dari Program J-StarX 500 Global
- Penyertaan Alchemist Accelerator
- Profil Syarikat
Pencapaian Syarikat
- 1000+ pelanggan enterprise berbayar
- $2.3M USD jumlah pelaburan sebagai SEED
- Pengiktirafan dari pemecut global (500 Global, Rainmaking APAC, AlchemistX)

Pasukan pelbagai kami termasuk pembangun AI elit dari SoftBank, Rakuten, IBM, dan banyak lagi
Gambaran Keseluruhan Infrastruktur Teknikal
Tindanan AI Teras
| Komponen | Teknologi |
|---|---|
| Pengecaman Pertuturan | Transformer terlatih tersuai dioptimumkan untuk bahasa Asia |
| Enjin Terjemahan | LLM dilaraskan dengan latihan khusus domain |
| Teks-ke-Pertuturan | Model penjanaan audio disintesis semula jadi emosi |
| Model Bahasa | Model khusus untuk terminologi perniagaan dan perbendaharaan kata teknikal |
| Pemprosesan Audio | Penstriman audio masa nyata dengan saluran paip DSP tersuai |
Tindanan Pembangunan
Frontend:- Teras: React, TypeScript, Flutter (iOS, Android)
- Masa nyata: WebSocket, WebRTC untuk penstriman audio
- Komponen UI: Ant Design, Flutter
- Utama: Node.js (TypeScript), Python (FastAPI), Golang
- API: REST
- Platform Awan: AWS, GCP, Azure, VPS, OnPremise
- CI/CD: GitHub Actions, Azure CodePipeline
- Alat: PyTorch, Hugging Face, Llama, Unsloth, Qwen
Tanggungjawab Teras
Pembangunan Infrastruktur
- Membina dan menyelenggara saluran paip pemprosesan audio masa nyata
- Melaksanakan titik akhir API berprestasi tinggi untuk perkhidmatan terjemahan
- Membangunkan dan mengoptimumkan sambungan WebSocket untuk terjemahan langsung
- Mencipta dan menyelenggara perkhidmatan mikro berkontena
Integrasi AI
- Bekerjasama dengan jurutera ML dalam penggunaan model
- Melaksanakan infrastruktur penyajian model
- Mengoptimumkan saluran paip inferens untuk latensi rendah
- Membangunkan sistem pemantauan untuk prestasi model
Penciptaan Model AI
- Mereka bentuk strategi saluran paip data dan mengumpul data berkualiti tinggi
- Melaraskan parameter model AI (hiperparameter, seni bina) untuk meningkatkan kecekapan VRAM dan kelajuan inferens
- Mencipta strategi penilaian model, menganalisis keputusan, dan menentukan hala tuju yang betul
- Menyelidik model dan kertas OSS terkini untuk menambah baik model semasa
- Menerbitkan artikel penyelidikan dan menyumbang kepada ekosistem OSS
Pembangunan Aplikasi
- Membina antara muka web responsif untuk terjemahan masa nyata
- Melaksanakan keupayaan terjemahan luar talian
- Mencipta alat pembangun dan SDK
- Membangunkan papan pemuka dalaman untuk pemantauan sistem
Keperluan Teknikal
Wajib Ada
- 0.5-3 tahun pengalaman dengan React dan TypeScript (atau keupayaan untuk mencipta prototaip frontend pantas)
- Beberapa pengalaman dengan Node.js dan Python atau rangka kerja serupa
- Pemahaman asas prinsip CI/CD
- Pengalaman dengan platform awan (AWS/GCP/Azure)
- Minat yang kuat dalam teknologi dan ekosistem AI
Bagus untuk Ada
- Pemprosesan digital Audio dan Video
- Pengetahuan tentang penggunaan model ML dan pengoptimuman inferens
- Lihat penyelidikan kami: Throughput Inferens Terjemahan, Kesesakan Terjemahan
- Latar belakang dalam penyelidikan NLP atau pengecaman pertuturan atau terjemahan
- Pemahaman tentang pengkomputeran berprestasi tinggi dan pemprosesan data boleh skala
- Lihat penyelidikan kami: Go WebSocket Proxy
Cabaran Teknikal Semasa
- Mengoptimumkan pemprosesan audio masa nyata untuk latensi rendah
- Penciptaan model E2E untuk terjemahan pertuturan emosi
- Penciptaan model E2E untuk bot ejen suara AI
- Menskalakan inferens model ML untuk meminimumkan kelajuan inferens dengan tenaga rendah
- Melaksanakan terjemahan luar talian yang cekap
- Membina sistem pemantauan yang teguh untuk menyokong infrastruktur kami
- Membangunkan SDK untuk integrasi pihak ketiga
- Pengumpulan dan penciptaan data latihan berbilang bahasa berskala besar
Peluang Pertumbuhan
- Mendalami infrastruktur dan ekosistem ML
- Mempelajari pemprosesan audio lanjutan
- Rangka kerja latihan pembelajaran mesin
- Saluran paip data untuk data latihan model AI
- Menguasai sistem teragih
Faedah
- Gaji kompetitif berdasarkan pengalaman: 7,000,000 - 12,000,000
- Pengaturan kerja fleksibel (hibrid/jarak jauh)
- Insurans kesihatan
- Bengkel teknikal tetap
Lokasi
- Tokyo (utama)
- Pejabat Singapura (berkembang) - jika anda mempunyai kediaman Singapura
- Pilihan kerja jarak jauh tersedia (Pada masa ini 85% jarak jauh, 15% pejabat)
Cara Memohon
Hantar ke [email protected]:- Resume/CV dengan projek teknikal
- Sila jelaskan bagaimana anda boleh menyumbang dan apa yang anda mahu lakukan
Kami sedang mencari pembangun yang bersemangat untuk membina masa depan AI suara dan teknologi terjemahan masa nyata!
