מעבדות גוגל העלתה השבוע בהשקה שקטה כלי מהפכני להפיכת כל טקסט – מאמר, סיפור, כתבה או מסמך – לחווית אודיו שמיעתית עשירה. תוכלו להקשיב בדרך לרכבת, בפקק, בטיול עם הכלב או במכון כושר לכל סיכום, והתוצאה לא פחות ממדהימה, ובחינם.
הכלי, שנמצא תחת פלטפורמת AI Studio של גוגל, מיועד לכל אחד – מסטודנטים שמבקשים להאזין למאמרים בזמן הליכה, דרך יוצרי תוכן שמעוניינים להנגיש את הכתבות שלהם לקהלים חדשים, ועד אנשים עם מוגבלות ראייה שרוצים לצרוך תוכן באוזן ולא בעין.
בשונה מכלים קיימים אחרים, הכלי של גוגל מציע גם אפשרות להקראת טקסטים מרובי דוברים, כלומר הקראת דיאלוגים באמצעות קריינים וירטואליים שונים, שכל אחד מהם נשמע שונה לחלוטין.
כדי להשתמש בפיצ’ר, אין צורך בידע מוקדם או מיומנויות טכנולוגיות. כל שנדרש הוא דפדפן אינטרנט. לאחר שנכנסים לכתובת https://aistudio.google.com/prompts/new_chat ניתן להתחיל תהליך פשוט של הפיכת טקסט לאודיו.
המשתמש יוצר “הנחיה חדשה”, בוחר את סוג ההנחיה כ”המרת טקסט לקול”, מדביק את הטקסט, ובוחר את הקריינים מתוך מגוון רחב של קולות אנושיים – צעירים, מבוגרים, נשים וגברים, ולעיתים גם בעלי מבטאים שונים בהתאם לשפה.
באפשרות המשתמש גם לקבוע אם מדובר בקריינות של קול אחד רציף, או קריינות מרובת דוברים, שם ניתן להקצות קול אחר לכל פסקה או שורה. לצורך כך, ניתן לסמן את הטקסט עם תגיות כמו [דובר 1] או [דובר 2] כדי שהמערכת תדע להחליף בין הקולות. בכך נוצרת הקראה דינמית, שמזכירה אודיו דרמטי או תסכית רדיו.
מלבד בחירת הקריינים, הפלטפורמה מאפשרת גם להתאים את קצב הדיבור, גובה הקול, טון הדיבור והדגשות קוליות. כך, ניתן לדוגמה להפוך מאמר מקצועי להקראה איטית ונינוחה, או סיפור לילדים לקול שמח ומדגיש. גוגל אף מציעה תמיכה בשפות רבות, כאשר בעברית – גם אם התמיכה עדיין בסיסית יחסית – ישנם כבר קולות איכותיים.
לאחר סיום הבחירות וההגדרות, לוחצים על כפתור “Generate” והמערכת יוצרת את קובץ האודיו. לאחר עיבוד קצר, שנמשך בין שניות בודדות לכמה דקות בהתאם לאורך הטקסט, מוצג הקובץ להאזנה ישירה. אם התוצאה משביעת רצון, ניתן גם להוריד את הקובץ בפורמטים MP3 או WAV ולשמור אותו.
השימושים האפשריים בפלטפורמה כמעט אינסופיים: סטודנטים יכולים להאזין לחומרי לימוד בזמן אימון או נסיעה, אנשי שיווק יכולים ליצור תכנים קוליים למיתוג, מורים יכולים להנגיש חומרים לתלמידים בעלי קשיי קריאה, ועיתונאים יכולים להפוך כתבות למדיה שמע המאפשרת חוויית קריאה נוספת.
בגוגל לא שכחו לעשות גם את הפעולה ההפוכה: ניתן להמיר קובץ קול גם לטקסט. התוצאה כאן לא תמיד מושלמת, וכמובן שהמשתמש נדרש לעבור על התוצאה ולתקן פה ושם טעויות בעברית. בדקנו את זה, ומה שמתקבל יצא לפחות לנו, מדוייק למדי, למעט תיקונים קלים פה ושם.
את המרת הקול לטקסט משתמשי גוגל כבר מכירים, בעיקר הסטודנטים שביניכם, מפלטפורמת NoteboolkLM המצויינת, ועתה כאמור היא גם ב- AI Studios בממשק קל פשוט וידידותי יותר.
גם בעולמות הפנאי וההורות נפתחו אפשרויות חדשות. הורים יכולים להקליט סיפורים בקולות שונים, כדי שילדים יוכלו להאזין להם לפני השינה. בני נוער יכולים להאזין לתכנים שהם כותבים לעצמם, כדי לבדוק איך הם “נשמעים”. וגם אנשים בעלי לקויות ראייה, שעד כה הסתמכו על תוכנות הקראה בסיסיות ומכאניות, יכולים ליהנות מחוויית שמע טבעית ומדוייקת.