اسپارک یک موتور تحلیلی متحد برای پردازش داده در مقیاس بزرگ است

شبیه سازی های هادوپ را به ما بسپارید

اسپارک روی هادوپ ، آپاچی Mesos ، Kubernetes ، مستقل یا در ابر اجرا می شود. این می تواند به منابع داده متنوع دسترسی داشته باشد. می توانید Spark را با استفاده از حالت خوشه مستقل آن ، در EC2 ، در Hadoop YARN ، در Mesos یا Kubernetes اجرا کنید . دسترسی به داده ها در HDFS ، Alluxio ، Apache Cassandra ، Apache HBase ، Apache Hive و صدها منبع داده دیگر.

عناوین پروژه Spark و نمونه کارهای ما:

  • یک چارچوب مبتنی بر فیوژن چند حالته برای تقویت IDS برای ایمن سازی محیط Big Data با استفاده از جرقه ، مجله امنیت اطلاعات و برنامه های کاربردی ، 2018 [Java / Spark]
  • استفاده از مدل یادگیری ماشین مبتنی بر جرقه در پخش داده های بزرگ برای پیش بینی وضعیت سلامت ، رایانه ها و مهندسی برق ، 2018 [Java / Spark]
  • پیش بینی مؤثر داده های گمشده در جرقه Apache در طی سری زمانی چند متغیره ، معاملات IEEE روی داده های بزرگ ، 2018 [Java / Spark]
  • پیش بینی سریال داده های بزرگ بر اساس نزدیکترین همسایگان محاسبات توزیع شده با Spark ، سیستم های دانش بنیان ، 2018 [Java / Spark]
  • تجزیه و تحلیل مقایسه ای از الگوریتم های برنامه ریزی کارآمد با انرژی برای برنامه های کاربردی داده های بزرگ ، معاملات IEEE در داده های بزرگ ، 2018 [Java / Spark]
  • گرایش به جریان داده ها با استفاده از داده های مکرر در مورد داده های بزرگ Big Data ، سیستم های دانش بنیان ، 2018 [Java / Spark]
  • استفاده از یادگیری ماشینی برای بهینه سازی موازی در برنامه های کاربردی داده های بزرگ ، سیستم های رایانه ای تولید نسل آینده ، 2018 [Java / Spark].
  • پیش بینی چند مرحله ای برای سری های زمانی بزرگ داده مبتنی بر یادگیری گروه ، سیستم های دانش بنیان ، 2018 [Java / Spark]
  • ارائه مقرون به صرفه از سرور ابری برای عملکرد قابل پیش بینی از تجزیه و تحلیل داده های بزرگ ، معاملات IEEE در سیستم های موازی و توزیع ، 2018 [Java / Spark]
  • سیستم مانیتورینگ ترافیک اینترنتی آنلاین با استفاده از جرقه جریان ، داده کاوی بزرگ و تجزیه و تحلیل ، 2018 [Java / Spark]
  • یک الگوریتم تقسیم داده واسطه ای برای کاهش اسکاج در محیط محاسبات جرقه ، معاملات IEEE در Cloud Computing ، 2018 [Java / Spark]
  • توزیع طبقه بندی نزدیکترین همسایه برای داده های چند برچسب در مقیاس بزرگ در مورد جرقه ، سیستم های رایانه ای تولید نسل آینده ، 2018 [Java / Spark].