האם k פירושו עבודה עם נתונים קטגוריים?

תוכן עניינים:

האם k פירושו עבודה עם נתונים קטגוריים?
האם k פירושו עבודה עם נתונים קטגוריים?

וִידֵאוֹ: האם k פירושו עבודה עם נתונים קטגוריים?

וִידֵאוֹ: האם k פירושו עבודה עם נתונים קטגוריים?
וִידֵאוֹ: Ross Coulthart: Recovered UFO, Hearings, David Grusch 2024, נוֹבֶמבֶּר
Anonim

ה-k-Means אלגוריתם אינו ישים לנתונים קטגוריים, מכיוון שמשתנים קטגוריים הם בדידים ואין להם מקור טבעי. אז חישוב מרחק אוקלידי עבור מרחב כזה אינו משמעותי.

האם נוכל להשתמש באשכולות עבור נתונים קטגוריים?

הנתונים הקטגוריים הומרו למספרים על ידי הקצאת ערך דירוג. זה מצב שמערך נתונים קטגורי יכול להיעשות מקבץ כמערכי נתונים מספריים.. ניתן לראות שיישום של היגיון זה, k- ממוצע מניב ביצועים זהים כמו בשימוש במערכים מספריים.

האם אפשר להשתמש במשמעות עבור משתנים קטגוריים?

אין שום דרך למצוא ממוצע מהנתונים האלה כי אין צבע עיניים "ממוצע". אתה יכול למצוא את הפרופורציות, אבל לא את הממוצע. מקווה שזה עוזר!

במה יש להשתמש כשהנתונים הם קטגוריים?

נתונים קטגוריים מנותחים באמצעות מצב והתפלגויות חציוניות, כאשר נתונים נומינליים מנותחים עם מצב בעוד שנתונים סידוריים משתמשים בשניהם. במקרים מסוימים, ניתן לנתח נתונים סידוריים גם באמצעות סטטיסטיקה חד-משתנית, סטטיסטיקה דו-משתנית, יישומי רגרסיה, מגמות ליניאריות ושיטות סיווג.

מהו התקבצות עם תכונות קטגוריות?

צבירת נתונים קטגורית מתייחסת למקרה שבו אובייקטי הנתונים מוגדרים על פני תכונות קטגוריות … כלומר, אין פונקציית סדר או מרחק אינהרנטית עבור הערכים הקטגוריים, וכן אין מיפוי מערכים קטגוריים למספריים הגיוני מבחינה סמנטית.

מוּמלָץ: