הקדמה

ראשיתו של מאגר העברית המדוברת בישראל (מעמ"ד) במיזם שאפתני שהציב כמטרה לעצמו כינון מאגר הקלטות גדול של העברית המדוברת בישראל, מאגר שישמש בסיס למחקר בתחומים שונים, כגון בלשנות, חינוך, חברה, תרבות, היסטוריה, וכן מחקר ויישומים טכנולוגיים מתוחכמים. מעמ"ד תוכנן מראשיתו כמאגר מידע מוקלט ומתומלל. המודל אשר על פיו תוכנן המאגר ראה לכלול מדגם מייצג של דוברי העברית בישראל אשר בו הקלטות ספונטניות על ידי 950 איש, ובסך הכול – עם תוספות אחדות – 1000 יחידות מוקלטות בנות 5000 מילים כל אחת, דהיינו מאגר בן חמישה מיליון מילה.

הגישה שננקטה על ידינו לכינון מעמ"ד היא גישה תלויית תרבות. מעמ"ד שואף לגשר בין אינספור חלופות השיח הנהוגות בקרב קהילת הדוברים של העברית הישראלית לבין ייצוגן במאגר על ידי אפיון השונוּת במונחים דימוגראפיים ונסיבתיים גם יחד. זהו ניסיון ראשון וייחודי לכונן מאגר מייצג על שני צירי משתנים, דימוגראפיים ותלויי נסיבות, בהתאם לקריטריונים סטטיסטיים ואנליטיים. בחירת המתנדבים להקלטות המאגר הראשי ראוי שתתבצע על ידי דגימה אקראית של אוכלוסיית ישראל, במטרה לשקף את המבנה החברתי של קהילת דוברי העברית בישראל. פילוח המאגר לצרכים אנליטיים טוב שייקבע על פי קריטריונים מוגדרים, אף כי כל הנתונים הסוציולינגויסטיים של מתנדבי מעמ"ד שיוקלטו יעמדו לרשות המשתמשים במאגר. הנחת העבודה של מעמ"ד מתבססת על ארבעה קריטריונים דימוגראפיים שנראים לנו החשובים ביותר ביצירת השונות הלשונית בישראל: (1‏) מקום לידה, ארץ מוצא המשפחה, עדה או דת; (2‏) גיל; (3‏) השכלה; (4) ומין.1 הנחת העבודה של מעמ"ד לניתוח נסיבות שיח מתבססת על חמישה משתנים: יחסים בינאישיים, מבנה השיח ונושא השיח כמשתנים עיקריים, ולצידם מספר המשתתפים בשיח וערוץ התקשורת (שיחה בעל-פה או שיחה טלפונית). עדיין לא נערך מחקר מקיף בחברה הישראלית לבדיקת הנתונים הדימוגראפיים והנתונים בדבר נסיבות השיח בשימוש העברית בה. לפיכך, כדי לעצב דגם ראוי למעמ"ד, המחקר וכינון המאגר צריכים להתבצע בשלבים, אשר במהלכם יש לבדוק את התאמת הנתונים הדימוגראפיים והנתונים הנסיבתיים כפי שהוצעו לעיל.

המודל הזה תואר לראשונה בדפי אינטרנט בעברית ובאנגלית ופורסם יותר מאוחר בכתב כלשונו בשפה האנגלית (Hary & Izre’el 2003 .(תקציר עברי של המודל התכנוני הראשוני של מעמ”ד פורסם על ידי הרי ויזרעאל תשס"ב(א). שני מאמרים מדעיים על המודל, אשר בהם שוכלל ועודן המודל במידה מסויימת, פורסמו באנגלית (Izre'el, Hary & Rahav 2001) ובעברית (יזרעאל, הרי ורהב תשס"ב(ב)).

 


 

1 על פי התכנון המקורי של מעמ"ד, המבנה האנליטי כלל רק את שלושת הקריטריונים הראשונים. קריטריון המין לא מצא את מקומו במבנה האנליטי משום שדגימה סטטיסטית ממילא הייתה מאזנת את מספר המתנדבים על פי מין. דרישות החוקרים באיפיון הדוברים היו מתממשות, אם כן, בשליפה מתוך המאגר על פי קריטריונים מוגדרים אלה.

אוניברסיטת תל אביב עושה כל מאמץ לכבד זכויות יוצרים. אם בבעלותך זכויות יוצרים בתכנים שנמצאים פה ו/או השימוש
שנעשה בתכנים אלה לדעתך מפר זכויות, נא לפנות בהקדם לכתובת שכאן >>