Whisper på svensk hårdvara

Spela in.
Transkribera.
Vem sa vad.

Ljud till text med talarseparering. Whisper-large-v3 körs på dedikerad GPU-hårdvara i Sverige. Dina ljudfiler lämnar aldrig landet.

Varför staik VOICE?

Whisper-modellen körs på dedikerad GPU-hårdvara i Sverige. Inga ljudfiler skickas utanför landet och inget används för AI-träning.

Pyannote 3.1 separerar talare automatiskt — perfekt för möten, intervjuer och poddar. Toggla på/av efter behov.

Samma API som OpenAI:s /v1/audio/transcriptions. Byt bara base_url. Stödjer mp3, wav, m4a, webm, ogg.

Från ljudfil till diariserad text på sekunder.

Dra in en ljudfil eller välj från enheten. Stödjer mp3, wav, m4a, webm och ogg upp till 100 MB.

WhisperX-pipelinen kör large-v3 på svensk GPU och pyannote separerar talarna med tidsstämplar per ord.

Få text, diariserad text, SRT, VTT eller JSON med ordnivå-tidsstämplar och talar-labels.