הבינה המלאכותית מתקדמת צעד דרמטי נוסף: אמש (רביעי) הכריזה חברת OpenAI על סוכן אינטליגנציה מלאכותית חדש בשם ChatGPT Agent שיפעל בתוך הפלטפורמה הפופולרית של ChatGPT. הסוכן, שכבר החל להתגלגל למשתמשי Pro ברחבי העולם, מאפשר לבצע פעולות דיגיטליות שלמות בשמו של המשתמש, תוך שימוש בדפדפן וירטואלי וביכולות מתקדמות של הפקת קבצים.
מדובר באחת ההכרזות המשמעותיות ביותר של החברה בשנה האחרונה. הסוכן מסוגל לתפקד כמעין עוזר אישי אוטומטי שמבין את ההוראות של המשתמש, ומבצע פעולות מורכבות באינטרנט ובעולמות העבודה הדיגיטלית. הדוגמאות שהודגמו עד כה כללו הפקת מצגות PowerPoint שלמות על בסיס מידע כלכלי, בניית גיליונות Excel עם ניתוחים, תיאום ערב זוגי על פי ההעדפות האישיות, מילוי טפסים מקוונים, שימוש בטרמינל תכנות, ואפילו הזמנת עוגות באינטרנט.
לפי איזָה פולפורד, ראש צוות המחקר שפיתח את הסוכן, אחד המבחנים הראשונים לשירות היה כשהיא ביקשה מהצ’אט להזמין עוגות לפי דרישות מדויקות. “זה לקח כמעט שעה, אבל זה היה עדיף על לעשות את זה בעצמי”, אמרה.
הסוכן החדש מאחד בין שני שירותים קודמים ש- Open AI השיקה מוקדם יותר השנה: אופרטור – שאיפשר לצ’אט ג’יפיטי להשתמש בדפדפן ויזואלי על מנת לנווט באתרים, ו-Deep Research שאיפשר לו לבצע עיבוד עמוק של מקורות מידע מרובים. כעת, השילוב בין השניים מאפשר לסוכן החדש לעבור בין מצב של ניווט ויזואלי לבין קריאת טקסטים, ולהתאים את עצמו למשימות שונות לפי הצורך.
למרות הדמיון לשירותים כמו Copilot של מיקרוסופט, הסוכן החדש לא מחליף ישירות את תוכנות האופיס של החברה, אך כן עשוי לצמצם את הצורך בהן. עובדה זו מעניינת במיוחד לאור העובדה שמיקרוסופט היא אחת המשקיעות הגדולות ב-Open AI והחברות נמצאות כעת במו”מ להמשך הגישה של מיקרוסופט למודלים של החברה.
הסוכן זמין תחילה למשתמשי פרו, צ’אט ג’יפיטי פלוס וטים כאשר משתמשי פרו יקבלו עד 400 פעולות Agent בחודש, ואחרים יקבלו 40 בלבד. בשלב זה לא ידוע מתי השירות יגיע למשתמשים החינמיים, אך ככל הנראה זה לא יקרה בקרוב.
במהלך ההדגמות שהוצגו לעיתונות ה-Agent הצליח לבצע מגוון פעולות החל מהפקת מצגת על תוצאות הרבעון של Nvidia ועד הזמנת מקום במסעדה תוך הצלבה עם היומן של המשתמש. משימות פשוטות כמו תיאום פגישה אורכות כחמש דקות, אך משימות מחקר עשויות להימשך 20 דקות ואף יותר. כל המשימות מתבצעות “כאילו היו במקביל”. כלומר, אפשר לבקש מהסוכן לבצע מספר משימות בו זמנית, יתרון משמעותי עבור משתמשים עסקיים.
אחת התכונות המסקרנות ביותר בהשקה היא האפשרות החדשה לצפות בשחזור הפעולה שביצע הסוכן – “replay”: במילים אחרות, המשתמש יכול לראות בדיוק היכן גלש הסוכן, אילו אתרים נפתחו, ואילו צעדים בוצעו כאילו מדובר בהקלטת מסך. כך, המשתמש שומר שליטה על מה שנעשה בשמו, ולומד כיצד הסוכן פועל.
עם זאת, החברה מציינת שפעולות מסוימות, למשל כניסה לרשתות חברתיות או אתרים פיננסיים, ידרשו אישור פעיל מהמשתמש. במקרים כאלה יפעל “מצב צפייה” שמחייב את המשתמש להישאר בעמוד הפעולה ולא לעבור לאפליקציה אחרת.
נכון לעכשיו, הסוכן החדש עדיין לא תומך בזיכרון האישי של המשתמש, כלומר הוא לא מסוגל לשלב ידע מהעבר או העדפות קודמות בעת ביצוע משימות חדשות. ב-Open AI מדגישים שהסיבה לכך היא בעיקר בטיחותית, ונובעת מהרצון להימנע ממצבים של “הזרקת פקודות” (prompt injection) שעלולה להוביל לשיבוש או ניצול לרעה של הסוכן.
למרות שהיכולות של הסוכן החדש אינן מושלמות, ויש משימות שלוקחות זמן לא מבוטל לביצוע, ברור לגמרי שמדובר בצעד משמעותי בדרך להפוך את ChatGPT לשחקן מרכזי לא רק בשיח הטקסטואלי, אלא גם בביצוע פעולות דיגיטליות של ממש. אם הטרנד של “סוכנים חכמים” יתפוס, וייתכן שזו רק שאלה של זמן, השימוש המסורתי בדפדפנים, טפסים ותוכנות משרדיות עשוי להשתנות מהיסוד. אולי בעתיד הקרוב נבלה פחות זמן בלהקליד, ולחפש, וללחוץ ויותר זמן בלבקש מהבינה המלאכותית לעשות גם את זה בשבילנו.