Office of Academic Resources
Chulalongkorn University
Chulalongkorn University

Home / Help

Titleการจัดสรรชิ้นส่วนข้อมูลบันทึกสารสนเทศในมองโกดีบี
Author บุญญฤทธิ์ อุณหะวัฒน์
Imprint 2559
Connect tohttp://cuir.car.chula.ac.th/handle/123456789/55349
Descript-

SUMMARY

ข้อมูลบันทึกสารสนเทศมีลักษณะที่ส่งผลกระทบต่อประสิทธิภาพการทำงานหากได้รับการพัฒนาที่ไม่เหมาะสมกับลักษณะข้อมูล จากการศึกษาพบว่าลักษณะแนวทางการกระจายตัวของชิ้นส่วนข้อมูลส่งผลถึงประสิทธิภาพการทำงานโดยรวมของระบบทั้งจากการจัดเก็บข้อมูลและการสืบค้น ซึ่งวิธีการกระจายข้อมูลที่มีมาแต่เดิมในระบบอันได้แก่การกระจายแบบพิสัยและแฮช(hash)นั้นมีข้อดีข้อเสียแตกต่างกันอย่างชัดเจน โดยเฉพาะเมื่อระบบอยู่ในสภาวะที่ต้องรองรับงานเกินขีดจำกัด เป้าหมายงานวิจัยนี้จะศึกษาถึงแนวทางการกระจายของข้อมูลและจัดสรรชิ้นส่วนข้อมูลให้อยู่ในลักษณะที่สามารถนำเอาทรัพยากรของระบบมาใช้ได้อย่างเต็มประสิทธิภาพและลดผลกระทบของภาระการทำงานของเครื่องในระบบ นี้ได้นำความสามารถของระบบการติดป้ายข้อมูลมาประยุกต์ใช้กับแผนการกระจายข้อมูลพื้นฐาน โดยในการทดลองเราได้จำลองระบบฐานข้อมูลแบบกระจายด้วย มองโกดีบี ขึ้นมาเพื่อใช้ในการวิจัยเปรียบเทียบประสิทธิภาพการทำงานโดยข้อมูลบันทึกสารสนเทศที่ถูกจำลองขึ้นมาใช้ในงานวิจัยนี้ได้ทำการอ้างอิงโครงสร้างข้อมูลจากระบบไอทีของมหาวิทยาลัยจุฬาลงกรณ์ และการทดลองจะวัดประสิทธิภาพจากการทำงานหลักๆสองประเภทได้แก่ การจัดเก็บข้อมูล และ การสืบค้นข้อมูล ภายใต้เงื่อนไขที่สภาพการทำงานของระบบอยุ่ในสภาวะปกติและทำงานหนัก ซึ่งประสิทธิภาพการทำงานจะถูกประเมิณจากปริมาณงานที่ทำเสร็จและเวลาที่ใช้ในการประมวลผล งานวิจัยนี้ได้นำเสนอกระบวนการกระจายข้อมูลแบบใหม่ที่เหมาะสมกับข้อมูลบันทึกสารสนเทศ โดยการประยุกต์การกระจายข้อมูลแบบติดป้ายข้อมูล ร่วมกับการคาดการณ์ความเร็วของข้อมูลขาเข้า ซึ่งทำให้ระบบสามารถจัดเก็บข้อมูลข้อมูลได้เร็วกว่าวิธีแบบพิสัยและแบบแฮช ในขณะที่ยังสามารถคงไว้ซึ่งประสิทธิภาพที่ดีในส่วนการสืบค้นข้อมูลไม่ว่าจะเป็นในภาวะที่ไม่มีการบันทึกข้อมูล จนถึงในภาวะที่มีการบันทึกข้อมูลจำนวนมาก
Log Data characteristics are fast growing and have large amount of data which end up affect system performance. Due to this reason, there are high demand of the distributed system that can answer the performance problems. According to the studied, data distribution strategy greatly affects overall system performance including both insert and query operation. Range and Hash data distribution strategy have different kind of advantage and disadvantage that will affect entire system especially during the time when system suffer from hotspot. The goal of this research is to study the data distribution strategy and data allocation and how to archive highest efficiency from using system resource and reduce the affect from performance problems. In this research, we take advantage of the tag aware function by incorporate function with range data distribution strategy. For the experiment, we simulate distribution database system using MongoDB for the purpose of compare the performance between each data distribution strategy. log data use in this experiment are based on the log data from Chulalongkorn University IT log system. There’re two main experiment which are insert data and data query based experiment. The performance evaluation will be measure by the insert throughput and the completion time. This research proposed a new data distribution strategy suitable for storing log data. Using tag distribution and incoming data velocity forecasting, our proposed strategy performed much faster than Range and Hash distribution for inserting operations. The strategy also performed very well for query operations during both light-load and heavy-load data insertion




Location



Office of Academic Resources, Chulalongkorn University, Phayathai Rd. Pathumwan Bangkok 10330 Thailand

Contact Us

Tel. 0-2218-2929,
0-2218-2927 (Library Service)
0-2218-2903 (Administrative Division)
Fax. 0-2215-3617, 0-2218-2907

Social Network

  line

facebook   instragram