Hadoop
Hadoop یک سیستم عامل محاسبه منبع باز ، مقیاس پذیر ، قابل اعتماد و توزیع شده برای اجرای MapReduce است که توسط بنیاد apache ایجاد شده است. این فریم ورک شامل اجرای سیستم فایل توزیع شده (Hadoop (HDFS و اجرای MapReduce است. Hadoop یک راه حل برای تجزیه و تحلیل داده های بزرگ بوده است. چارچوب Hadoop ابزاری برای بازیکنان اصلی از جمله IBM ، Google و Yahoo در ذخیره سازی ، تجزیه و تحلیل و مدیریت داده های بزرگ است. Hadoop بدون در نظر گرفتن ساختار آن ، توانایی پردازش مقادیر زیادی از داده ها را دارد. برای حل مشکل ایجاد فهرست های جستجوی وب در گوگل ، چارچوب MapReduce نیروگاهی است که در پشت بیشتر پردازش داده های بزرگ امروز قرار دارد. نوآوری مهم MapReduce امکان گرفتن یک پرس و جو از یک مجموعه داده ، تقسیم آن و اجرای آن به صورت موازی بر روی گره های متعدد است. توزیع محاسبات مسئله داده های بسیار بزرگ را برای جا دادن روی یک دستگاه واحد حل می کند. این روش را با سرورهای کالایی لینوکس ترکیب کنید و یک گزینه جایگزین مقرون به صرفه برای آرایه های محاسباتی گسترده داشته باشید.