תמלול אוטומטי של וידאו ואודיו באמצעות Whisper

וויספר (Whisper) היא מערכת לזיהוי דיבור (ASR: Automatic Speech Recognition) מבית OpenAI הזמינה לציבור הרחב בקוד פתוח. מערכת זו אומנה על יותר מ-680 אלף שעות של אודיו באנגלית ובשפות רבות אחרות – בהן גם עברית וערבית. מטרת מחברות אלו היא להנגיש את יכולות התמלול של המערכת לציבור הרחב בצורה אינטואיטיבית ונוחה.

על אף שוויספר מיועדת בעיקר לתמלול קבצי אודיו, המערכת יכולה לעבוד גם עם סוגים אחרים של קלט דיבור, כגון נתוני וידאו המכילים דיבור. באופן כללי, המערכת יכולה לקבל כל סוג של קלט אודיו או דיבור בפורמט דיגיטלי שנתמך על ידי ספריית ffmpeg4, ובכלל זה קבצים בפורמט WAV, MP3, MP4 ו-MOV.

שימוש נכון במחברות

כדי להשתמש במחברות יש להיעזר ב-Google Colab, כלי שמאפשר לנו לצפות ולהריץ את המחברות שהכנו עבורכם מראש. כדי לפתוח מחברת בסביבת Google Colab יש ללחוץ על הכפתור הבא שנמצא בראשית כל מחברת:

סוגי מחברות במאגר

מאגר (Repository) זה מכיל מחברות לשימושים שונים:

1. Whisper_Audio.ipynb: מחברת לתמלול קבצי אודיו או וידאו (ישירות - ללא צורך בחילוץ שכבת האודיו). למתחילים מומלץ להתחיל עם מחברת זו.
2. Whisper_Video.ipynb: מחברת זו מאפשרת לתמלל קבצי וידאו תוך חילוץ שכבת האודיו. לאחר מכן ניתן להשוות את איכות הפלט אל מול המקור.
3. Whisper_from_Youtube.ipynb: מחברת זו מאפשרת להוריד ולתמלל סרטונים מ-Yotube.
4. Whisper_Speaker_Diarization.ipynb: מחברת לתמלול ראיונות וזיהוי דוברים.

בתוך תיקיית OtherASRs ניתן למצוא 2 מחברות נוספות לתמלול:

1. ASR_SpeechBrain_Amharic.ipynb: מחברת לתמלול מהשפה האמהרית. מחברת זו, העושה שימוש ב-SpeechBrain, Wav2Vec2 ו-Pydub, מאפשרת תמלול של קבצי WAV בלבד ונועדה לשימוש מתקדם.

2. fairseq_meta_mms.ipynb: מחברת לתמלול המבוססת על פרויקט ה-MMS של חברת Meta שתומך ב-1,000 שפות. מחברת זו מאפשרת תמלול של קבצי WAV בלבד ונועדה לשימוש מתקדם.

Name		Name	Last commit message	Last commit date
Latest commit History 306 Commits
Colab		Colab
Kaggle		Kaggle
OtherASRs		OtherASRs
Resources		Resources
README.md		README.md
ivrit_ai_whisper_large_v2_tuned_vs_whisper_large_v3_.ipynb		ivrit_ai_whisper_large_v2_tuned_vs_whisper_large_v3_.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

תמלול אוטומטי של וידאו ואודיו באמצעות Whisper

שימוש נכון במחברות

סוגי מחברות במאגר

דוגמה מתוך המחברות

About

Releases

Packages

Languages

Sourasky-DHLAB/Whisper

Folders and files

Latest commit

History

Repository files navigation

תמלול אוטומטי של וידאו ואודיו באמצעות Whisper

שימוש נכון במחברות

סוגי מחברות במאגר

דוגמה מתוך המחברות

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages