Please enable JavaScript.
Coggle requires JavaScript to display documents.
การวิเคราะห์ข้อมูลทางสถิติ, การวิเคราะห์ข้อมูลทางสถิติ -…
-
-
ทำความเข้าใจลักษณะข้อมูล
จากข้อมูลข้อมูลและวิธีการจัดระเบียบเราจะทำการตัดสินใจเกี่ยวกับเครื่องมือที่จะใช้ในการรักษาทำความสะอาดแปลงร่างทำให้เป็นมาตรฐานและกำหนดข้อมูลสำหรับการสร้างแบบจำลองเชิงคาดการณ์ การตัดสินใจที่จะเกิดขึ้นตามลำดับขึ้นอยู่กับข้อมูลเช่นค่าเฉลี่ยความแปรปรวนส่วนเบี่ยงเบนมาตรฐานการแจกแจงเป็นต้น
ตารางความถี่ในการอธิบายข้อมูล:หนึ่งในวิธีที่ง่ายที่สุดในการอธิบายข้อมูลคือผ่านตารางความถี่ - แผนภูมิแสดงตารางความถี่ซึ่งสะท้อนถึงการสังเกตที่เกิดขึ้นในข้อมูล นั่นคือเราสังเกตปรากฏการณ์บางอย่างรวบรวมข้อมูลแล้วจัดตาราง - เราสร้างตารางความถี่ แต่ละบรรทัดหรือค่าสอดคล้องกับคลาส - หมวดหมู่ ความถี่จะแตกต่างกันไปขึ้นอยู่กับจำนวนของแต่ละคลาสในชุด หนึ่งในแอปพลิเคชันหลักของปัญญาประดิษฐ์คือการประมวลผลภาษาธรรมชาติซึ่งเป็นแอปพลิเคชันคอมพิวเตอร์ที่สามารถจดจำเสียงและดำเนินการหรืออ่านข้อความและสร้างข้อมูลสรุปได้ด้วยตัวเอง!
การแจกแจงความถี่:การแจกแจงความถี่เป็นเครื่องมือหลักอย่างหนึ่งของสถิติเชิงพรรณนาซึ่งแสดงการสังเกตข้อมูลจำนวนหนึ่งในช่วงเวลาที่กำหนดซึ่งเป็นวิธีการใส่ข้อมูลเพิ่มเติมในตารางความถี่ ในการสร้างการแจกแจงความถี่เราสร้างรายการกำหนดช่วงกำหนดจำนวนชั้นเรียนกำหนดช่วงชั้นเรียนและสร้างการแจกแจงความถี่ (ตารางความถี่พร้อมข้อมูลเพิ่มเติม) เพื่อให้เข้าใจข้อมูลได้ดีขึ้น
สถิติเชิงพรรณนาจะถูกนำไปใช้เป็นหลักในช่วงเริ่มต้นของโครงการวิเคราะห์ แต่เทคนิคและเครื่องมือที่นำเสนอโดยสถิติเชิงพรรณนาสามารถใช้ได้เกือบทุกขั้นตอนของกระบวนการ - เครื่องมือในการสรุปข้อมูลแสดงภาพข้อมูลแสดงภาพความสัมพันธ์สรุปความถี่ของข้อมูล เป็นต้น
-
-
-
-
แผนภูมิแท่ง:เป็นหนึ่งในแผนภูมิที่ใช้มากที่สุดในการวิเคราะห์ข้อมูล เราแสดงตารางความถี่ผ่านแท่งบนแผนภูมิแท่ง นั่นคือแต่ละแท่งแสดงถึงสัดส่วนของความถี่ในตารางความถี่
แผนภูมิพาเรโต:สามารถสร้างด้วยแท่งที่แสดงถึงแต่ละคลาสในตารางความถี่ ความสูงของแต่ละแท่งสัมพันธ์กับความถี่และตามสัดส่วน
การกำหนดสถิติ
รวบรวมข้อมูล: สถิติช่วยให้เรารวบรวมข้อมูลกล่าวคือมีเครื่องมือสำหรับเทคนิคการสุ่มตัวอย่าง - เราแทบจะไม่รวบรวมข้อมูลทั้งหมดในปรากฏการณ์เดียว ตัวอย่างที่พบบ่อยคือการวิจัยเกี่ยวกับการเลือกตั้งซึ่งหน่วยงานต่างๆทำการวิจัยกับกลุ่มตัวอย่างโดยอาศัยเทคนิคและขั้นตอนทางสถิติ
จัดระเบียบข้อมูล: นอกจากการรวบรวมแล้วเรายังสามารถจัดระเบียบข้อมูลด้วยเครื่องมือทางสถิติ เราสามารถจัดตารางคำนวณความถี่วางข้อมูลอย่างเป็นระเบียบและดำเนินการตามลำดับขั้นตอนการวิเคราะห์หรือแม้แต่การสร้างแบบจำลองเชิงคาดการณ์
ส่งข้อมูล: ด้วยสถิติเรายังสามารถนำเสนอข้อมูลผ่านกราฟทางสถิติซึ่งการแสดงภาพที่สรุปหรือทำให้ข้อมูลนั้นง่ายขึ้น
อธิบายข้อมูล: เราอธิบายข้อมูลได้! นั่นคือค่าเฉลี่ยของแอตทริบิวต์ที่กำหนดค่ามัธยฐานหรือค่าสูงสุดคือเท่าใด ข้อมูลเป็นไปตามการแจกแจงปกติหรือไม่? คำอธิบายนี้ช่วยให้เราเข้าใจวิธีจัดระเบียบข้อมูลเพื่ออำนวยความสะดวกในการตัดสินใจ
ตีความข้อมูล: ในที่สุดเราก็สามารถทำงานที่สำคัญที่สุดของทั้งหมดได้สำเร็จนั่นคือการตีความข้อมูล จากการตีความนี้โดยใช้เครื่องมือทางสถิติคือเราสามารถอนุมานเกี่ยวกับประชากรผ่านรายการเล็ก ๆ
สถิติเป็นศาสตร์ที่ช่วยให้เราเรียนรู้จากข้อมูล ในขณะที่เราอยู่ในยุคของ Big Data ข้อมูลชุดใหญ่นี้ถูกสร้างขึ้นในปริมาณมากความหลากหลายและความเร็วสูงจึงเป็นเรื่องง่ายที่จะเข้าใจว่าสถิติกลายเป็นเครื่องมือสำคัญในการวิเคราะห์ในปัจจุบันดังนั้นเราจึงต้องการเทคนิคเครื่องมือและกระบวนการที่ช่วยให้เราสามารถวิเคราะห์ปริมาณข้อมูลและสถิติทำให้เรามีเครื่องมือเหล่านี้มากมายเพื่อดึงข้อมูลจำนวนมากที่เกี่ยวข้องกับการทำความเข้าใจสถานการณ์ปัจจุบันและการตัดสินใจ
-
ดังนั้นเราต้องกำหนดประเภทของข้อมูลที่เรากำลังดำเนินการเพื่อให้ทราบถึงเทคนิคการวิเคราะห์ทางสถิติที่เหมาะสมที่สุดในการใช้ โดยพื้นฐานแล้วเรามีการจำแนกประเภทหลักสองประเภท - เชิงปริมาณและเชิงคุณภาพ:
คุณสมบัติที่กำหนด: อาชีพเพศศาสนา - ไม่มีลำดับชั้นที่กำหนดระหว่างข้อมูล ข้อมูลเชิงคุณภาพเล็กน้อยแสดงถึงรายละเอียดของข้อมูลและไม่อนุญาตให้จัดอันดับ
คุณสมบัติตามลำดับ: ในบางสถานการณ์เรามีการจัดลำดับหรือลำดับชั้นที่ชัดเจนระหว่างหมวดหมู่ (การจัดอันดับ) เช่นการเรียนการสอนชั้นทางสังคมและการวางตำแหน่งในคิว
ปริมาณที่ไม่ต่อเนื่อง: เป็นค่าที่สามารถนับได้เราสามารถนับจำนวนลูกจำนวนรถที่จอดจำนวนการเข้าชมของเว็บไซต์การชอบในสิ่งพิมพ์ ได้แก่ ค่า จำกัด - มูลค่าและจำนวนเต็ม
เชิงปริมาณต่อเนื่อง: ข้อมูลที่สามารถรับค่าใด ๆ ภายในช่วงของค่าเช่นน้ำหนักส่วนสูงเงินเดือน ฯลฯ สิ่งเหล่านี้เป็นข้อสังเกตที่สามารถวัดได้และโดยปกติจะเป็นค่าทศนิยมค่าที่วัดได้
-
-
-
-
-
-
-