BraveFirst is a Data Mining use case of Apache Spark and relative tools. It is developed for IBM Spark competition.
8月9日8月23日的日程表8月17日 继续解决未解决的问题 所有人
8月17日
8月9日21日 测试验证产品
8月22日23日 提交第二版作品 罗辉
##Use case Recommandation. Batch Data:train a model and use batch data to do recommandation. Streaming Data: use the model to process streaming data for recommandation.
##Data Open data from movielens and yelp
##Architecture Data visualization: Apache Zeppelin
Web System:Spring MVC or Play2
Machine Learning Framework: Spark MLlib
Data Warehouse and ETL:SparkSQL + Hive
Data Storage: HDFS
Streaming Data Flow:Kafka or Flume