کتاب Hadoop

بدون ديدگاه

برای باز کردن قدرت داده های خود آماده شوید. با ویرایش چهارم این راهنمای جامع ، یاد می گیرید که چگونه سیستم های توزیع شده قابل اطمینان ، مقیاس پذیر و پراکنده را با Apache Hadoop تهیه و نگهداری کنید. این کتاب برای برنامه نویسان ایده آل است که به دنبال تجزیه و تحلیل داده های داده از هر اندازه و برای مدیرانی هستند که می خواهند خوشه های Hadoop را راه اندازی و اجرا کنند.

تام وایت با استفاده از Hadoop 2 به طور انحصاری ، فصل های جدیدی را در مورد YARN و چندین پروژه مرتبط با Hadoop مانند پارکت ، فلوم ، جرقه Crunchand ارائه می دهد. در مورد تغییرات اخیر در Hadoopand خواهید آموخت که مطالعات جدیدی را در مورد نقش Hadoop در سیستم های مراقبت های بهداشتی و پردازش داده های ژنومی بررسی می کند.

  • مؤلفه های اساسی مانند MapReduce ، HDFSand YARN را بیاموزید
  • MapReduce را به عمق کاوش کنید ، از جمله مراحل توسعه برنامه های کاربردی با آن
  • یک خوشه Hadoop با HDFS و MapReduce را در YARN تنظیم و نگهداری کنید
  • دو قالب داده را بیاموزید: Avro برای سریال سازی داده ها و پارکت برای داده های تو در تو
  • از ابزارهای ورودی داده مانند Flume (برای پخش داده) و Sqoop (برای انتقال داده فله) استفاده کنید
  • درک کنید که چگونه ابزارهای پردازش داده سطح بالا مانند Pig ، Hive ، Crunchand Spark با Hadoop کار می کنند
  • پایگاه داده توزیع شده HBase و سرویس پیکربندی توزیع شده ZooKeeper را بیاموزید

نوشتن دیدگاه

نشانی ایمیل شما منتشر نخواهد شد.

دو × 5 =