OpenAI
Whisper Large V3
OpenAI Whisper'ın en güçlü ve doğru ses tanıma modeli
Input 0 kredi/dak.
Output 0 kredi/dak.
Hakkında
Whisper Large V3, OpenAI tarafından geliştirilen en doğru konuşma tanıma yapay zeka modelidir. 1.55B parametre Encoder-Decoder Transformer mimarisi ile 99'dan fazla dili destekler. Türkçe'de yaklaşık %6-8 WER (Word Error Rate) ile yüksek doğruluk sağlar. Detaylı transkripsiyon ve zaman damgası desteği sunar. Parel platformunda KVKK uyumlu, lokal çalışan STT çözümü olarak kullanılabilir.
Kullanım Alanları
- › Toplantı ve konferans transkripsiyonu
- › Müşteri çağrı merkezi kaydı analizi
- › Video ve podcast altyazı üretimi
- › Sesli not ve dikte uygulamaları
- › Erişilebilirlik ve işitme engelli destek araçları
- Provider
- OpenAI
- Tür
- Ses Tanıma
- Uyumluluk
- OpenAI SDK
- Model ID
- whisper-large-v3
- Input Fiyat
- 0 kredi/dak.
- Output Fiyat
- 0 kredi/dak.
Benzer Modeller
OpenAI SDK ile dakikalar içinde entegre edin.
Authentication #
API anahtarınızı ortam değişkeni olarak tanımlayın.
import os
os.environ["OPENAI_API_KEY"] = "pk-..."Kurulum #
OpenAI SDK'yi yükleyin.
pip install openaiSes Transkripsiyonu #
Ses dosyasini metne donusturun.
from openai import OpenAI
client = OpenAI(
base_url="https://api.parel.cloud/v1",
api_key="pk-...",
)
with open("ses.mp3", "rb") as audio:
transcript = client.audio.transcriptions.create(
model="whisper-large-v3",
file=audio,
language="tr",
)
print(transcript.text)Parametreler #
Transkripsiyon formatini ve ayarlarini degistirin.
from openai import OpenAI
client = OpenAI(
base_url="https://api.parel.cloud/v1",
api_key="pk-...",
)
with open("ses.mp3", "rb") as audio:
transcript = client.audio.transcriptions.create(
model="whisper-large-v3",
file=audio,
language="tr",
response_format="srt", # json, text, srt, vtt, verbose_json
timestamp_granularities=["word", "segment"],
)
print(transcript)Kayıt olun, API anahtarınızı alın.