在 Scala 中编码和解码数据的最快方法

阿曼达

我有以下 csv 文件:

Name    Age City    Start   Stop    Point
Mike    29  Fuji    10      30      5
Mike    29  Fuji    0       10      7
Susan   26  Fuji    77      1000    9

我正在尝试访问 Point、给定的名称、年龄、城市和范围

给出的例子:

Mike, 29, Fuji, 15 will yield 5
Mike, 29, Fuji, 5 will yield 7
Susan, 26, Fuji, 990 will yield 9
Susan, 26, Fuji, 1500 will yield 0 since there's no match

我阅读了 csv 并尝试构建一个 Scala Map[String, Map[Int, Map[String, Map[Int, Int]]]] 但鉴于我有几千条记录,这不是很可扩展。开始和停止范围是不相交的,并且必须与其他行相关。

如何在不使用 SQL 数据库或 KeyValue 存储的情况下有效地编码和解码此数据?任何帮助将不胜感激。

扎克·佐哈尔

这是一个使用 case 类作为键 ( Person) 和范围 ( RangeAndPoint)的天真版本- 帖子中缺少一些细节(例如,范围是否包含/不包含?它们是否不相交?找不到匹配范围的结果应该是什么?如果发现不止一个?) - 但这些可以在答案中修复:

case class Person(name: String, age: Int, city: String)

case class RangeAndPoint(start: Int, end: Int, point: Int) {
  def inRange(value: Int): Boolean = value < end && value >= start
}

// Let's assume CSV was read into such a format - I'll hard-code it here for the example:
val persons: Map[Person, List[RangeAndPoint]] = Map(
  Person("Mike", 29, "Fuji") -> List(RangeAndPoint(10, 30, 5), RangeAndPoint(0, 10, 7)),
  Person("Susan", 26, "Fuji") -> List(RangeAndPoint(77, 1000, 9))
)

// returns the expected result or None if no match found:
def getPoint(name: String, age: Int, city: String, value: Int): Option[Int] = {
  persons
    .get(Person(name, age, city))
    .flatMap(_.find(_.inRange(value)))
    .map(_.point)
}

println(getPoint("Mike", 29, "Fuji", 15))   // Some(5)
println(getPoint("Mike", 29, "Fuji", 5))    // Some(7)
println(getPoint("Susan", 26, "Fuji", 990)) // Some(9)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章