logistic回归 c++ 实现.pdf
文本预览下载声明
jfc
logistic 回归 c++ 实现
logistic 回归是统计学习中经典的分类方法,他属于对数线性模型。本博文主要给出
logistic 的c++实现,具体理论请读者自行google。
本文用到的数据集来自于一个医学网站,具体出处不记得了(非常歉意)。数据的格式如
下:
10009 1 0 0 1 0 1
10025 0 0 1 2 0 0
20035 0 0 1 0 0 1
20053 1 0 0 0 0 0
30627 1 0 1 2 0 0
30648 2 0 0 0 1 0
每行有7 个列值,第一列是一个ID 号,在具体操作中,忽略该列。之后的5 列,每一个都表
示一个特征的取值;最后一列是分类标记(0 或 1)。
在具体实现时,将分隔数据为训练数据和测试数据,并保存到文件中,文件组织形式如
下:
其中testdata.txt,保存测试数据;traindata.txt 保存训练数据;logistic.cpp 是代码源文
件。三个文件保存在同一目录下。
实现代码如下:
/*********
logistic 回归(c++) by 姜富春
**********/
#includeiostream
#includefstream
#includevector
#includesstream
#includecmath
using namespace std;
struct Data{
vectorint features;
int cls;
Data(vectorint f,int c):features(f),cls(c){
}
};
struct Param{
vectordouble w;
double d;
Param(vectordouble w1,double d1):w(w1),d(d1){};
Param():w(vectordouble()),d(0.0){}
};
class Logistic{
public:
Logistic(){
//载入traindata 文件构造dataSet;
loadDataSet(dataSet);
//初始化Param,w 的长度与数据特征的长度相同,初值为0.0。d
vectordouble pw(dataSet[0].features.size(),0.0);
Param pt(pw,0.0);
param=pt;
};
void loadDataSet(vectorData ds,string dataFile=./traindata.txt){
ifstream fin(dataFile.c_str());
if(!fin){
cout文件打开失败endl;
exit(0);
}
while(fin){
string line;
getline(fin,line);
if(line.size()3){
stringstream sin(line);
int t;
sint;
vectorint fea;
while(sin){
char c=sin.p
显示全部