ספריית מילוני נתונים - טרמינולוגיית נתוני אדם
תקציר
מילון-על של מערך הדיגיטל הלאומי לרשומת האדם: 99 שדות סטנדרטיים המחולקים ל-13 קטגוריות (פרטים כלליים, כתובת ומגורים, פרטי התקשרות, חינוך ותעסוקה, קשרים משפחתיים, משפטי, זהות ושיוך ועוד). 42 שדות קשורים לאחד מ-33 מילוני קוד אחידים; 17 מהם מקושרים ישירות למילונים רשמיים קיימים של הממשלה (כגון סמל יישוב, סמל שפה ISO, סמל דת). הספרייה משמשת שפה משותפת בין גופים לצורך אינטגרציה בין מערכות, מניעת כפילויות וניתוח נתונים אחיד.
תובנות עיקריות
- ריכוז ב"פרטים כלליים": 23 מתוך 99 שדות (כ-23.2%) שייכים לקטגוריה אחת — שדות זיהוי, שמות, תאריכי לידה ופטירה, מעמד בישראל וכד'.
- שיעור השדות המסודרים במילון קוד: 42 שדות (כ-42.4%) עוגנים לאחד מ-33 מילוני הקוד; 57 שדות (כ-57.6%) הם שדות חופשיים — מזהים, שמות, תאריכים ומספרים שאינם דורשים ערכים מסווגים.
- מילונים משותפים: חמישה מילונים משמשים יותר משדה אחד — ארצות (4 שדות: ארץ לידה, ארץ עלייה, מדינת אזרחות, סמל ארץ מנפיקה), יישובים (3), שפות (3), סוג מקום לידה/פטירה (2) ורחובות (2).
- עוגנים למילונים רשמיים קיימים: 17 שדות מצביעים על שם מילון רשמי במאגרי הממשלה — למשל SemelMigdar (מגדר), SemelDat (דת), SemelLeom (לאום), SemelMatzavIshi (מצב אישי) ו-SemelLanguageISO (שפה). המשמעות: הספרייה מתממשקת ישירות למקורות קוד מוסכמים ולא יוצרת מילונים מקבילים.
- חלוקה לפי תחומי חיים: קטגוריות "כתובת ומגורים" (13 שדות) ו"פרטי התקשרות" (11 שדות) מכסות יחד כרבע מהרשומה ומשתמשות בעיקר במילונים גיאוגרפיים — יישובים, רחובות, מחוזות, נפות, שכונות ורשויות מקומיות.
- הקשר ספרייתי: הספרייה היא חלק מסדרת מילוני נתונים של מערך הדיגיטל הלאומי, לצד ספריות לרשומות נכס ועסק; כל הספריות חולקות את אותם עקרונות מבנה ועוגני מילונים רשמיים.
התפלגות השדות לפי קטגוריה
הצג כטבלה
| קטגוריה | שדות |
|---|---|
| פרטים כלליים | 23 |
| כתובת ומגורים | 13 |
| פרטי התקשרות | 11 |
| זכויות וזכאויות | 10 |
| חינוך,השכלה ותעסוקה | 10 |
| קשרים משפחתיים | 6 |
| משפטי | 6 |
| זהות ושיוך | 5 |
| מיסוי, נכסים ועסקים | 5 |
| שירות וביטחון | 3 |
| תחבורה | 3 |
| רשויות מקומיות | 2 |
| זכויות אזרחיות | 2 |
שדות המסודרים במילון קוד לעומת שדות חופשיים
שדות המסודרים במילון קוד שדות חופשיים (שמות, מזהים, תאריכים)
הצג כטבלה
| קטגוריה | עם מילון | חופשיים |
|---|---|---|
| פרטים כלליים | 12 | 11 |
| כתובת ומגורים | 8 | 5 |
| פרטי התקשרות | 5 | 6 |
| זכויות וזכאויות | 2 | 8 |
| חינוך,השכלה ותעסוקה | 6 | 4 |
| קשרים משפחתיים | 2 | 4 |
| משפטי | 0 | 6 |
| זהות ושיוך | 5 | 0 |
| מיסוי, נכסים ועסקים | 0 | 5 |
| שירות וביטחון | 0 | 3 |
| תחבורה | 1 | 2 |
| רשויות מקומיות | 1 | 1 |
| זכויות אזרחיות | 0 | 2 |
מילוני הקוד המשותפים — שימוש חוזר בין שדות
רק חמישה מבין 33 מילוני הקוד משמשים יותר משדה אחד. שאר ה-28 הם מילונים ייעודיים (מגדר, דת, לאום, רמות השכלה וכו') המשמשים שדה יחיד.
הצג כטבלה
| מילון קוד | שדות שמשתמשים בו | שמות השדות |
|---|---|---|
| ארצות | 4 | סמל ארץ מנפיקה, ארץ לידה, ארץ עלייה, מדינת אזרחות |
| יישובים | 3 | יישוב לידה, יישוב מגורים, יישוב עבודה |
| שפות | 3 | שפת אם, שפה עיקרית, שפת שירות מועדפת |
| סוג מקום לידה ופטירה | 2 | סוג מקום לידה, סוג מקום פטירה |
| רחובות | 2 | רחוב (מגורים), רחוב עבודה |
תיאור מקורי
--גרסה בהרצה-- ספריית מילונים זו מהווה את הטרמינולוגיה האחודה לערכים הנוגעים ליישות אדם. בספרייה זו ניתן למצוא את מבנה רשומת הנתונים המרכזית וכן אוסף מילונים המכילים את הערכים הרלוונטיים לנתונים שברשומה זו. מילון (code lists או list of values) הוא רשימת ערכים וסיווגים אחידה. מילוני הקוד עבור היישות אדם, מרכזים ערכים סטנדרטיים ואחידים לתיאור מאפיינים שונים של פרטים באוכלוסייה, כגון מאפיינים דמוגרפיים, סטטוסים מנהליים, שיוכים גיאוגרפיים ומאפייני חיים נוספים. מילונים אלו נועדו לייצר שפה משותפת בין גופים ממשלתיים ובמגזר הציבורי בכללותו, וכן בין מגזרים, לאפשר אינטגרציה בין מערכות ולתמוך בניתוחים סטטיסטיים ותפעוליים על בסיס נתונים עקבי ואיכותי. השימוש במילונים יאפשר אחידות בהגדרות, יקטין כפילויות וחוסר התאמה, ויתרום לשיפור קבלת ההחלטות והתכנון. נודה לקבלת הצעות לתוספות של נתונים, מילונים או כל טיוב אחר מוצע לכתובת המייל- [email protected]