佳礼资讯网

 找回密码
 注册

ADVERTISEMENT

12
返回列表 发新帖
楼主: tensaix2j

Data mining 讨论区

[复制链接]
 楼主| 发表于 5-4-2008 10:33 AM | 显示全部楼层
其因为 model 就是 define 那些 X 跟 y 的关系。。。

不过, x 跟 y 的关系 往往是 很复杂的。。

因为 有时 不只是 一 个 y
也有 可能 是 多个 y

例如
x1  x2  x3  x4  x5      y1  y2  y3  y4  y5
1   2    3    4    5        12  13  10  11  10

[ 本帖最后由 tensaix2j 于 5-4-2008 10:35 AM 编辑 ]
回复

使用道具 举报


ADVERTISEMENT

 楼主| 发表于 5-4-2008 10:36 AM | 显示全部楼层
我听过数学上 可以 用 什么newton 还是 lagrange  interpolation
找出 一个 polynomial of n个 degree 的。。

[ 本帖最后由 tensaix2j 于 5-4-2008 10:43 AM 编辑 ]
回复

使用道具 举报

 楼主| 发表于 5-4-2008 10:47 AM | 显示全部楼层
不过, 问题就是 这里。。。

比如说 我们 今天 有 1000 个data
我们 用 数学 model 出 他的 polynomial of 1000 degree,
fit 到 准准 那种。。。。

那么 我们 的 model 就很有可能 overfit 了。。
也就是说

以后 那些unseen (没看过) 的 data 来的时候 呢。。
我们 的 model 可能 就完全 无法 预测 它的 y
了 ,因为 不够 generalized 。。。
回复

使用道具 举报

发表于 16-4-2008 02:42 PM | 显示全部楼层
你真的是天才
触角伸到Data Mining了
有没有试过Weka??
回复

使用道具 举报

发表于 16-4-2008 03:47 PM | 显示全部楼层
哇!你的楼好久没有来顶一下了 。。。

其实每个algorithm应该都有它本身generalization的方法。 不是嘛 。。。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

 

ADVERTISEMENT



ADVERTISEMENT



ADVERTISEMENT

ADVERTISEMENT


版权所有 © 1996-2023 Cari Internet Sdn Bhd (483575-W)|IPSERVERONE 提供云主机|广告刊登|关于我们|私隐权|免控|投诉|联络|脸书|佳礼资讯网

GMT+8, 16-2-2025 01:18 PM , Processed in 0.149787 second(s), 21 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表