我正在为电影做一个推荐系统,使用这里提供的MovieLens数据集:
http://grouplens.org/datasets/movielens/
http://grouplens.org/datasets/movielens/
为了计算这个推荐系统,我在scala中使用了Flink的ML库,特别是ALS算法(org.apache.flink.ml.recommendation.ALS).
我首先将电影的等级映射到DataSet [(Int,Int,Double)],然后创建trainingSet和testSet(参见下面的代码).
我的问题是当我使用ALS.fit函数和整个数据集(所有评级)时没有错误,但如果我只删除一个评级,那么fit函数不再起作用了,我不知道明白为什么.
你有什么想法?