29 באפריל 2024 11:12

כריית מידע – המאגר הגדול / Data mining – The big data

השינוי המבני הגדול שהתרחש לאחרונה בתאגיד גוגל עורר עניין רב ברחבי העולם, כאשר נעשתה הפרדה בין חברת גוגל, אשר תספק את שירותי האינטרנט (ובכלל כך מנוע החיפוש, יוטיוב, שירות המפות ואפליקציות נוספות), לחברת אלפבית ושאר חברות הבת בתאגיד הענק. השינוי המבני אך מיצב מחדש את משמעות גוגל כארגון המידע, וכפועל יוצא – ארגון כריית המידע, המוביל בעולם.

כאשר תאר ג’ורג’ האוול את האח הגדול, בספרו המפורסם 1984, הוא חשב על עולם שבו יהיו גורמים שיידעו עלינו הכול. צעד אחד מעבר למחשבה הזו, היה מוביל לשאלה המתבקשת – איך? מילא שיאספו מידע רב אודותינו אבל מאיסוף המידע ועד לידיעה בפועל הדרך ארוכה. על כך בדיוק חושבים היום גופים רבים שאוחזים במידע. קחו למשל את כל בתי החולים בארץ. אם היו מחברים את כל המידע שנצבר שם למאגר אחד גדול, היה ניתן להסיק מסקנות רבות ביחס למחלות מהם סובלים תושבי הארץ, רק מחיתוכים במידע וחיפושים סטטיסטיים אשר יוכלו ללמד על מחלה זו או אחרת לפי התנהגות או תופעות שחוזרות על עצמן.

ידע מצטבר על אדם יכול לעזור בהיבטים רבים, החל מייעול עסקים, דרך מחקרים רפואיים, עבור בריגול ולוחמה בטרור ועד לניתוחים מדעיים ומחקרים פורצי דרך. כך כמובן, ניתן לעשות שימוש בידע שנצבר גם בתחום השיווק, תחום שיכול להיות רלבנטי לחברות רבות. אלו יוכלו לחבר מידע על אנשים, הרגלי ההתנהגות שלהם, תרבות התשלומים, נושאי עניין, חתך הכנסה, אזור מגורים, גודל המשפחה ועוד פרטים רבים. חיבור המידע הזה יוביל להצעות שיווקיות מותאמות לאנשים אליהן יופנו.

השאלה היא כמובן מה זה בדיוק פעולת כריית המידע הזו ואיך עושים אותה נכון? איך יוצרים את המאגר הגדול הזה במסגרת הוראות החוק, מה ניתן לאסוף במסגרתו ואיך ניתן לפעול על-פיו?

כריית מידע או כריית נתונים (Data mining) היא הפעלת אלגוריתם או תוכנת מחשב לצורך גילוי מידע הטמון בבסיסי נתונים קיימים, והסקת מסקנות מעיבוד המידע והצלבתו. גילוי ידע בבסיסי נתונים הוא תהליך שנועד לחקור ולנתח כמות גדולה של מידע באמצעים אוטומטיים ככל שניתן כדי לגלות דפוסים תקפים חדשים, שימושיים ובעלי משמעות, לגורם שמבצע את אותה כריית מידע. עם ההתפתחות המתמדת בעולם טכנולוגיית המידע, כשכמות המידע הדיגיטלי גדלה כל הזמן, עולה החשיבות של תחום כריית המידע, שבאמצעותו ניתן להפוך מידע לידע, וידע זה כוח.

צרוף פעולת כריית המידע עם אחזקת מאגר נתונים גדול ככל האפשר, יכולה לבסס פעולה יעילה יותר בבסיס הנתונים ותוצאות שיובילו לידע רב יותר. ככל והמידע בבסיס הנתונים יהיה גדול יותר, כך גם התוצאות יהיו רלבנטיות יותר.

המושג כריית מידע נגזר, אומנם, מפעולת הכרייה הגיאולוגית בה כורים באדמה כדי למצוא אוצרות טבע. אבל הדרך להשגת אותו מאגר גדול, כדי לבצע בו את אותה פעולת כריית נתונים לא פשוטה כלל. על פי החוק, כדי לעשות את אותה פעולת עיבוד מידע במאגר נתונים גדול, דרושה הסכמת מושאי המידע. כדי לעשות פעולה כזו ללא הסכמתם יהיה על הגורם המבצע לשכנע, כי לא פגע בפרטיותם של אלה, המצויים במאגר. בנוסף לכך על המאגר להיות בנוי משפטית נכון כדי לקלוט את הפעילות הזו. בנייה נכונה, בדומה לבניית כור חציבה, יכול ותוליד "אוצר" של ממש.

לא תמיד חברות העוסקות באותה פעולה של כריית מידע אכן עושות זאת נכון. לפעמים האזרח הקטן יחוש בכך כאשר יקבל הצעה המותאמת אליו וישאל את עצמו איך זה קרה, שהצעה שקיבל תפורה כל-כך לממדיו. כמובן שדבר זה אינו מפתיע וכבר כיום ישנם חברות רבות העוסקות בתחום התאמת השיווק לקהל היעד, במיוחד בעולם הטכנולוגי. לעיתים קרובות פעולת הכרייה תסתיים מבלי שבכלל נדע שהיינו חלק ממנה. למשל אותם בתי חולים שיבקשו לברר על סמך מקרי אמת, ממצאים לגבי מחלות שונות ומאפיינים שלהם. החולים שהמידע שלהם ישמש בסיס לכך, לא יידעו שהדבר נעשה. שאלה אחרת האם פעולה כזו, שאיננו יודעים עליה, פוגעת בנו? כמו תמיד, התשובה אי שם באמצע, מצד אחד אנו ממילא נחשפים לפרסומות לעייפה, מוטב כבר שפרסומות אלו יהיו רלוונטיות לנו; מן הצד השני, איפה עובר הגבול ואיזה סוג מידע נאסף? שהרי מדובר בחרב פיפיות, מידע שפועל לטובתי היום, יכול מחר לשמש כלי כנגדי.

דרך ההתמודדות עם הסוגיה מהצד של האזרח היא להיות ערני יותר למה שקורה סביבו, הן מבחינת סוג והיקף המידע אותו הוא מוסר, הן ביחס לשימושים הצפויים להיעשות במידע שמסר, והן להצעות שהוא מקבל מגורמים שונים. מהצד השני, חברות שמבצעות את אותה כריית מידע צריכות להיזהר שלא לעבור את הגבול בין המותר לאסור. הגבול הזה הוא, לפעמים, דק מאוד. כמו בכל דבר, מי שטורח לפני ועושה זאת נכון, יכול ליהנות טוב יותר מהפירות בשלב הבא.

שתפו את הפוסט:

Facebook
Twitter
LinkedIn

דירוג האיכות של Dun's 100 לשנת 2024: משרד דן חי ושות' דורג שוב בקבוצת האיכות הראשונה בתחום הסייבר

דירוג האיכות של מדריך dun’s 100 פרסם את דירוג משרדי עורכי הדין לשנת 2024. בתחום הסייבר המדריך דירג, את משרד דן חי ושות', שוב, תחת ...

הרשות להגנת הפרטיות פרסמה גילוי דעת בנושא איסוף מספרי תעודות זהות וצילום תעודות זהות

בעת האחרונה ישנה מגמה גוברת של בתי עסק הדורשים מהלקוח למסור מספר תעודת זהות לצורך מתן שירות, ולעיתים אף דורשים למסור צילום של תעודת הזהות ...

טיוטת מסמך מדיניות חדשה בנושא איסוף ושימוש במידע ביומטרי במקום העבודה

על רקע המגמה הגוברת בשימוש טכנולוגיות לזיהוי ביומטרי אשר נעשה על ידי ארגונים לצרכי בקרת נוכחות עובדיהם, הרשות להגנת הפרטיות פרסמה לאחרונה (15.02.2024) מסמך מדיניות ...

באירופה עובדים. ה-AI ACT אושר.

מאת : צוות דן חי הפרלמנט האירופי אישר (13.03.2024) את תקנות הבינה המלאכותית (AI ACT). המדובר בחקיקה הראשונה מסוגה בעולם ובאה להסדיר את הפיתוח ההפעלה ...
דילוג לתוכן