Please enable JavaScript.
Coggle requires JavaScript to display documents.
Data Science, Modle =
Framework that display parameters - Coggle Diagram
Data Science
הרצאה 3
KMeans:star:
אלגוריתם למציאת המיקום האופטימלי של הסנטרואידים
עם הבאה למינימום סך המרחקים הריבועיים של האוביירטים מהסנטרואידים
Centroids - סנטרואיד
היא נקודת דאטא פוינט שהיא מרכז הקלאסטר. הנקודה נקבעת ע"י מיצוי שאר הנקודות בקלאסטר

בתמונה אלו הנקודות הירוקות
Algorithm Psuedo Code
- choose K initial centroids (the farther the initial location- the better)
- assign each data point to the closet centroid
- update the centroids of each cluster
- repeat 2+3 until no much changes happened
- Return: the partition into K groups
How To do it with Excel
- Represent the data as Datapoints with Excel PivotTable
- Define an equivalent optimization problem
- Use ExcelSolver :smiley:
Optimization Problem in my words
הפקת מידע מהדטא לצורך קבלת החלטות לאור אילוצים
לדוגמא בעיית הדיאטה:
מזינים את סך קלוריות,שומן וסוכרם, והתקציב שמותר לי (האילוצים)
ובהתאם הוא מחשב את הדטא להוציא רשימת מוצרים זולה שתספק לי את מה שאני צריך לאור האילוצים
הרצאה 1
Intro
-
-
מושגים אחרים
Paradaim Shift
כל מה שהיה עד עכשיו לא רלוונטי והולך לפח, וצריך לשנות את כללי המשחק על מנת להתאים עצמנו לחדשנות ולמדע החדש
הרצאה 2
Clustering
The Clustering Problem
Data Point - סדרה של מספרים
מיקום גיאומטרי שמייצג מידע על תחום מסוים. עם יחס כלשהו בין הנקודות
בהתאם לצירים וערכי האובייקט אנחנו יודעים להבדיל בין דומי ושוני של אובייקט
Cluster is a set of data-points
נרצה לחלק את הקלאסטר למס' קבוצות שונות, כך שכל אובייקטים באותו הקבוצה קרובים ודוומים, ואף רחוקים מאובייקטים של הקבוצות השונות.
Similarity & Distance
Distance Measure
זוהי פונקציה שלוקחת דאטא פוינטס, כלומר שני סדרות של מספרים
ומחזירה את מידת המרחק שלהן אחת מהשניה.
:star:מרחק אוקלידי
חישב השוני בין שני אובייקטים, כלומר המרחק בין שני נקודות, לפי הרחבת נוסחת פיתגורס
-
-
-
-
-