ביוני 2016, ספריית הנטינגטון, אוניברסיטת צפון קרולינה והמוזיאון על שם לינקולן יזמו פרויקט ענק: פענוח ותמלול 16,000 מברקים שנשלחו במהלך מלחמת האזרחים בארה״ב בין הנשיא לינקולן, הקבינט שלו וקציני צבא הפדרציה. באוסף, שבמשך שנים חשבו שאבד או הושמד, היו 100 מברקים שנכתבו בכתב ידו של לינקולן עצמו וכן ספרי צופן, בו נשלחו חלק מהמברקים. הקוד מעולם לא פוצח על ידי צבא הקונפדרציה.
לצורך קיטלוג המבקרים, עורכי הפרויקט העלו סריקות של המברקים לאינטרנט ובקשו ממתנדבים לפענח את הכתוב בהם, שרובו בכתב יד.
4866 איש נענו למשימה (יש להניח שחלקם היו סטודנטים שהוכרחו לעשות זאת:)) ונכון ליוני 217, 72% מהפרויקט כבר הושלם.
איך עושים זאת בפועל? זהו הנושא של הרשומה הזו.
ספריות ציבוריות כבר מזמן אינן רק מקום לשאול בו ספרים. זה מוטיב שחוזר הרבה בבלוג הזה והוא מעסיק את מיטב המוחות בתחום הספריות.
ישנן ספריות שהרחיבו את הביטוי לתחומים נוספים, עד כלי גינון וכלי נגינה. ההיגיון: מטרת הספרייה היא להנגיש ידע, תרבות וכלים על ידי העמדתם לרשות הציבור. ובכן, ״כלים״ אינם רק מטאפורה... לפעמים הכלים הם ממש כלי עבודה.
אבל לא לשם כך התכנסנו. אלא כדי לספר לכם שבניו יורק ספריות ציבוריות תתחלנה להציע למנויים ומנויות סרטים בסטרימינג כחלק מהשירות.
אנחנו היינו קודם
במדינה קטנה במזרח התיכון (לא לבנון. טיפה למטה... כן, בדיוק שם) כבר עושים זאת!
אתר הוידאו, פרי יוזמה של הנהלת איגוד הספריות הציבוריות והעומדת בראשו תרצה שקד כהן, מציע למנויות ומנויי ספריות את הסרטים שלנו, להשאלה לתקופות שונות, כבר כמעט שנה שלמה.
אבל עוד כמה מילים על היוזמה בארה״ב (תמיד זה נשמע יותר טוב. אמריקה, יו נואו):
הספרייה הציבורית של ניו יורק והספרייה הציברית של ברוקלין (רגע, ברוקלין זה לא ניו יורק?) חברו לחברת קאנופי, שבדרך כלל מספקת סרטים לאוניברסיטאות. הספריות למעשה מסבסדות את הסרטים מהקטלוג של קאנופי עבור המנויים שלהן.
לקאנופי יש 30,000 סרטים בקטלוג שזה המון, אבל כל מנוי או מנויה יכולים לבחור עד שישה סרטים.
נחמד.
אצלנו לעומת זאת, מנויות ומנויים יכולים לבחור כמה סרטים שבא להם, כל זמן שזה עומד בתקציב שהספרייה מקצה להם. ומאחר שמחירי השאלה אצלנו נמוכים, זה יכול להגיע גם למאות סרטים.
אז קדימה, ישראלים בברוקלין, תארזו מזוודות ותחזרו לארץ. סוף סוף יש עבור מה.
ואם את או אתה מנהלים ספרייה ועדיין לא במיזם, זה הזמן להצטרף. משלמים רק על סרטים שמושאלים בפועל. אין דמי מנוי, דמי טיפול, דמי לא יחרץ או כל דמים נסתרים.
תמלול של תוכן אודיו וההבנה של מה שנאמר בו הם אתגר אדיר, הן לאנשי ארכיון והן לעיתונאים, סטודנטים ויוצרי סרטים. צליל מוקלט הוא מבחינת המחשב אוסף של ביטים חסרי משמעות. טוב, לא לגמרי. זיהוי קולי כבר קיים לא מעט שנים, אלא שהוא מוגבל מאוד. כל מי שניסה לבקש מהעוזר האישי של אפל, גוגל, אמאזון או מיקרוסופט לבצע פעולה, יודע שמדובר במשימה עם הרבה חורים. המכונה תתפקד טוב יותר כאשר תלמד לזהות את קולכם, היא מתקשה לבודד רעשי רקע, צריכה שתדברו ברור ופעמים רבות היא פשוט לא מבינה מה רציתם, אלא אם הצגתם שאלה או משימה בצורה ברורה וחד משמעית, מבחינת מבנה המשפט.
כשמשווים זאת ליכולת האנושית, בה אנשים מבינים אותנו גם בנסיבות רועשות וכאשר אנחנו אומרים מילים לא ברורות כמו ״זה״ ״מה שמו״ ושאר ביטויים עמומים, המערכת הממוחשבת נראית רע מאוד.
אבל יש התפתחויות. כל הזמן. נספר לכם כאן על פרויקט ציבורי ואקדמי מענין בתחום. חוסר המסחריות שלו אילץ את המפתחים לבצע אינטגרציה של שורת כלים בקוד פתוח, מה שהופך אותו למרתק אף יותר. רשות הדיבור לפרויקט HiPSTAS.
מחשבים יודעים לקרוא טקסט, דבר זה ידוע. אם הטקסט הוא בפורמט ממוחשב - זה ברור, אפילו בנאלי. וגם הטכנולוגיה שמאפשרת לתרגם טקסט סרוק למילים (OCR) עובדת לא רע כבר הרבה שנים, לפחות עבור אותיות לטיניות.
המקום בו המהנדסים מזיעים קשה הוא הבנת משמעות של טקסט. ההבנה העמוקה, האנושית, של המסר שמועבר מתוך רצף המילים. המידע, הרגש (סנטימנט), העמדה (בעד, נגד), הדימויים ומשמעותם, הומור, דברים והיפוכם (מה שמכונה בשוגג "ציניות"), קריאה בין השיטין ועוד.
אם הטקסט לימודי, האם המחשב מסוגל להבין ממנו, למשל איך מכינים פיצה, במקרה שהטקסט הוא מתכון?
הנושא נופל תחת ההגדרה הכוללנית של בינה מלאכותית ונחשב לאחד האתגרים הקשים בתחום זה.
כל כך קשה, שפתרונו נחשב לזה שמקרב את הבינה המלאכותית ליכולות, או יותר נכון מורכבות, של חשיבה אנושית. AI Complete קוראים לזה ובינה שמסוגלת להבין טקסט לעומקו מכונה גם Strong AI. בינה חזקה הפכה למילת מפתח אצל סופרי מדע בדיוני. אמצו אותה אם אתם בענין של לכתוב ספר מדע בדיוני דיסטופי בו האנושות מושמדת כלאחר יד, מתוך בוז עמוק שרוחשת לה הבינה החזקה.
מיזנתרופים המייחלים לקץ האנושות? המשיכו לקרוא!
סקרנים לדעת איך זה עובד? גם המשיכו לקרוא!
לא תתאכזבו, בשני המקרים.
הספרייה הלאומית של נורבגיה החלה בפרויקט נסיוני של קיטלוג ויזואלי מבוסס בינה מלאכותית (AI), בתחום הראייה הממוחשבת (Computer vision).
הסתכלו על התמונה למעלה. שימו לב לאזורים המסומנים בריבועים ולתיאורים שצמודים אליהם. מדובר בגישה מהפכנית, הן לקיטלוג והן לאופן בו המידע מושג.
רק 25% ממבקרי הספריות בארה"ב השאילו ספר אלקטרוני מהספריה הציבורית, כך מעלה סקר שנערך על ידי BISG - Book Industry Study Group.
הנתון הנמוך להפתיע נראה אניגמטי עוד יותר כאשר מביאים בחשבון את הפופולריות הגבוהה של ספרים אלקטרוניים בארה"ב מצד אחד ואת המודעות הגבוהה לכך שיש בספריה הציבורית ספרים אלקטרוניים להשאלה מן הצד השני. 58% אמרו שהם יודעים שניתן לשאול ספרים אלקטרוניים בספריה. ההאזנה לספרים קוליים נמוכה אף יותר ועומדת על 9%.
איך מסבירים את הנתונים האלו?



