搭配上时间的变数,会让运算复杂度升高非常多。
数据的起点在于“资料”,而资料之间会在“变数”上产生关系。
观察资料时,可以试着对资料先做分群,以年龄来举例,我们收集资料时会是一组1岁的资料、一组2岁的资料、一组3岁的资料…等,我可以将这些资料分组成1~3岁一组、4~8岁一组、9~12岁一组,而要如何分组,目前没有特别有效的演算发可以协助找出,应该需要透过对该领域的了解,用经验来试着分组,然后从整理出的结果再往后推敲更多可能性。
某些情况下,如果用累计的方式做分组,也可以取得意外的结果。
变数必须可以被量度,否则无法进一步分析。
我们通常会去看变数之间的“关联性”(Correlation),譬如小孩的起床时间与学习效率之间的关联性。
要验证关联性,就需要实验数据(Experiment)佐证,这边我们可切分两种变数类型,
独立变数与相依变数可以用几率学的独立事件或相依事件来理解。