Skip to content

Google Colab Notebooks for Transcription with Whisper

Notifications You must be signed in to change notification settings

Sourasky-DHLAB/Whisper

Repository files navigation

תמלול אוטומטי של וידאו ואודיו באמצעות Whisper

וויספר (Whisper) היא מערכת לזיהוי דיבור (ASR: Automatic Speech Recognition) מבית OpenAI הזמינה לציבור הרחב בקוד פתוח. מערכת זו אומנה על יותר מ-680 אלף שעות של אודיו באנגלית ובשפות רבות אחרות – בהן גם עברית וערבית. מטרת מחברות אלו היא להנגיש את יכולות התמלול של המערכת לציבור הרחב בצורה אינטואיטיבית ונוחה.

על אף שוויספר מיועדת בעיקר לתמלול קבצי אודיו, המערכת יכולה לעבוד גם עם סוגים אחרים של קלט דיבור, כגון נתוני וידאו המכילים דיבור. באופן כללי, המערכת יכולה לקבל כל סוג של קלט אודיו או דיבור בפורמט דיגיטלי שנתמך על ידי ספריית ffmpeg4, ובכלל זה קבצים בפורמט WAV, MP3, MP4 ו-MOV.

שימוש נכון במחברות

כדי להשתמש במחברות יש להיעזר ב-Google Colab, כלי שמאפשר לנו לצפות ולהריץ את המחברות שהכנו עבורכם מראש. כדי לפתוח מחברת בסביבת Google Colab יש ללחוץ על הכפתור הבא שנמצא בראשית כל מחברת:

סוגי מחברות במאגר

מאגר (Repository) זה מכיל מחברות לשימושים שונים:

1. Whisper_Audio.ipynb: מחברת לתמלול קבצי אודיו או וידאו (ישירות - ללא צורך בחילוץ שכבת האודיו). למתחילים מומלץ להתחיל עם מחברת זו.
2. Whisper_Video.ipynb: מחברת זו מאפשרת לתמלל קבצי וידאו תוך חילוץ שכבת האודיו. לאחר מכן ניתן להשוות את איכות הפלט אל מול המקור.
3. Whisper_from_Youtube.ipynb: מחברת זו מאפשרת להוריד ולתמלל סרטונים מ-Yotube.
4. Whisper_Speaker_Diarization.ipynb: מחברת לתמלול ראיונות וזיהוי דוברים.
 
בתוך תיקיית OtherASRs ניתן למצוא 2 מחברות נוספות לתמלול:
1. ASR_SpeechBrain_Amharic.ipynb: מחברת לתמלול מהשפה האמהרית. מחברת זו, העושה שימוש ב-SpeechBrain, Wav2Vec2 ו-Pydub, מאפשרת תמלול של קבצי WAV בלבד ונועדה לשימוש מתקדם.
2. fairseq_meta_mms.ipynb: מחברת לתמלול המבוססת על פרויקט ה-MMS של חברת Meta שתומך ב-1,000 שפות. מחברת זו מאפשרת תמלול של קבצי WAV בלבד ונועדה לשימוש מתקדם.

דוגמה מתוך המחברות

About

Google Colab Notebooks for Transcription with Whisper

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published