Whisper på svensk hårdvara

Spela in.
Transkribera.
Vem sa vad.

Ljud till text med talarseparering. Whisper-large-v3 körs på dedikerad GPU-hårdvara i Sverige. Dina ljudfiler lämnar aldrig landet.

Så funkar det

Har du en API-nyckel? Logga in

Varför staik VOICE?

Din data stannar i Sverige

Whisper-modellen körs på dedikerad GPU-hårdvara i Sverige. Inga ljudfiler skickas utanför landet och inget används för AI-träning.

Talarseparering inkluderad

Pyannote 3.1 separerar talare automatiskt — perfekt för möten, intervjuer och poddar. Toggla på/av efter behov.

Drop-in OpenAI Whisper

Samma API som OpenAI:s /v1/audio/transcriptions. Byt bara base_url. Stödjer mp3, wav, m4a, webm, ogg.

Så funkar det

Från ljudfil till diariserad text på sekunder.

1

Ladda upp

Dra in en ljudfil eller välj från enheten. Stödjer mp3, wav, m4a, webm och ogg upp till 100 MB.

2

AI transkriberar

WhisperX-pipelinen kör large-v3 på svensk GPU och pyannote separerar talarna med tidsstämplar per ord.

3

Exportera

Få text, diariserad text, SRT, VTT eller JSON med ordnivå-tidsstämplar och talar-labels.