บทความ & ข่าว

Apache Hadoop คืออะไรApache Hadoop-คืออะไร-what-is.png

Apache Hadoop คืออะไร

Apache Hadoop คือ ไลบรารีซอฟต์แวร์ เป็นเฟรมเวิร์กที่ช่วยให้สามารถประมวลผลข้อมูลขนาดใหญ่ในกลุ่มของเครื่องคอมพิวเตอร์โดยใช้แบบจำลองการเขียนโปรแกรมแบบง่าย Apache Hadoop ได้รับการออกแบบมาเพื่อเพิ่มขนาดจากเซิร์ฟเวอร์เดี่ยวเป็นพัน ๆเครื่อง โดยแต่ละเครื่องมีการคำนวณและจัดเก็บข้อมูลใน local แทนการอาศัยการทำงานของฮาร์ดแวร์ให้ทำงานหนักขึ้นเพื่อมอบความพร้อมต่อความต้องการ Apache Hadoop  ได้รับการออกแบบมาเพื่อตรวจจับ และจัดการความล้มเหลวในชั้นแอพพลิเคชันเพื่อให้บริการที่พร้อมใช้งานบนกลุ่มเครื่องคอมพิวเตอร์แต่ละเครื่องอาจมีแนวโน้มที่จะเกิดความล้มเหลว

แพลตฟอร์มที่สนับสนุน

- GNU / Linux ได้รับการสนับสนุนในฐานะแพลตฟอร์มการพัฒนาและการผลิต Hadoop ได้รับการแสดงในกลุ่ม GNU / Linux ที่มีโหนด 2000
- Windows เป็นแพลตฟอร์มที่สนับสนุน แต่ขั้นตอนต่อไปนี้มีไว้สำหรับ Linux เท่านั้น การตั้งค่า Hadoop บน Windows, เห็นหน้าวิกิพีเดีย

ซอฟต์แวร์ที่จำเป็นสำหรับ Linux ประกอบด้วย :
- ต้องติดตั้ง Java ™ แนะนำรุ่น Java จะมีคำอธิบายที่HadoopJavaVersions
- ต้องมีการติดตั้ง ssh และ sshd ต้องทำงานเพื่อใช้สคริปต์ Hadoop ที่จัดการภูต Hadoop ระยะไกล

การติดตั้งซอฟต์แวร์
หากคลัสเตอร์ของคุณไม่มีซอฟต์แวร์ที่จำเป็นคุณจะต้องติดตั้ง
ตัวอย่างเช่นใน Ubuntu Linux :

  $ sudo apt-get install ssh
  $ sudo apt-get install rsync

 

โครงการ Apache ™Hadoop® พัฒนาซอฟต์แวร์โอเพนซอร์สเพื่อการคำนวณแบบกระจายและเชื่อถือได้

 


url : https://aoostudio.com/single-blog.php?id=32