使用脚本自动跑实验(Ubuntu),将实验结果记录在文件中,并在实验结束之后将结果通过邮件发送到邮箱,最后在windows端自动解析成excel表格(因为要在windows的origin上作图)。
SHELL
touch run.sh #创建但不编辑脚本
chmod 777 run.sh #给予脚本执行权限
gedit run.sh #编辑脚本
-
脚本中可以创建变量,如直接
x='100'
或r='rm -rf'
即可,${x}
在执行的时候以字符串形式读取。
- 注意变量创建时使用单引号,等于号前后不要有空格,可以是命令,可以使变量,反正都是字符串。
-
如何以数字方式解析变量?被以
$(())
包裹的变量将以数字形式解析,比如在某行中有这个参数:--num=$((${n}*1000000))
,这里${n}
将被以数字形式解析。 -
变量为路径:建议使用绝对路径。如想创建用于接收结果文件
receive='/home/renjc/easy-test2.txt'
之后touch ${receive}
,当然变量本质上是以字符串形式读取的,用receive='../xx.txt'
当然也行,还更灵活,就是程序容易整错。
- 脚本中若想执行命令,直接新一行然后将命令打上去就可以了,不需要额外的东西,脚本本质上还是一行一行执行的
- 若命令中想带参数,可以直接用变量替换
-
数组,
volumn='128 512 1024 2048'
即是数组,也可以当做一串字符串来解析。
#遍历数组,循环,遍历文件夹
workloads="./works/workloada.spec ./works/workloadb.spec ./works/workloadf.spec"
for file_name in $workloads; do
./ycsbc -db redis -threads 1 -P $file_name
done
#下面这个是单纯的for循环
for ((tn=1; tn<=8; tn=tn*2)); do
doneworkload
#下面这个是遍历文件夹workload_dir中所有以workload开头的spec文件
for file_name in $workload_dir/workload*.spec; do
done
- 函数,函数直接写在执行前就行
#函数作用是记录name,当前时间,以及初步计算value
recordstart(){
time=$(date)
echo "db_name: ${1}" >> ${receive}
echo -n "start_time: ${time} and Value:" >> ${receive}
echo "scale=2;${3}*${4}/1024/1000"|bc >> ${receive}
#纯shell对除法的支持比较粗糙,如果想要保留两位小数,可以向上面这行一样。
}
-
$(date)
代表当前时间,带年月日时分秒的那种。 -
shell脚本的函数参数并不需要申明什么的,
${1}
就代表函数第一个参数,以此类推,其中按照惯例,${0}
代表函数名(或者说程序名)。调用函数也很简单,recordstart name ${v}
即可调用,函数名后面的都是参数,在函数中使用${1},${2},${3}
识别。 -
echo -n "xx" >> ${receive}
,只有echo
的话,会输出到控制台中,加上>> ${receive}
会输出到这个文件里面,加上-n代表这一行不换行,因为echo
默认是每次都换行的。
使用以上几种组合基本可以完成绝大部分实验与程序。以下作为例子
这个作为例子(已折叠,可展开)
receive='/home/renjc/spkv/resault/easy-test2.txt'
touch ${receive}
ulimit -Sn 16384
ulimit -Hn 32768
#解除堆栈限制,可能需要,先预备
rocksdb_base='rocksdb-base/db_bench'
rocksdb_split='rocksdb-split/db_bench'
wisckey='WiscKey-master/WiscKey/out-static/db_bench'
# database="${rocksdb_base} ${rocksdb_split} ${wisckey}"
rmstore='rm -rf /home/renjc/spkv/db/*'
recordstart(){
#${1} db_name,${2} number of threads,${3} value_size,${4} number of rows
time=$(date)
echo "db_name: ${1}" >> ${receive}
echo "thread_num: ${2}" >> ${receive}
echo "value_size: ${3}" >> ${receive}
echo "num:${4}" >> ${receive}
echo "start_time: ${time}" >> ${receive}
echo -n "resault GB is:" >> ${receive}
echo "scale=2;${3}*${4}/1024/1000/1000"|bc >> ${receive}
}
recordend(){
time=$(date)
echo "done_time: ${time},----clean store and sleep 10s-------------------" >> ${receive}
${rmstore}
sleep 10s
}
#rocksdb 用一个杠两个杠都行,leveldb/wisckey只能用两个,统一采用两个杠杠。
const_arg='--db=/home/renjc/spkv/db --bloom_bits=0 --write_buffer_size=134217728'
rocksdb_arg='--compression_type=none' #Wisckey do not support but rocksdb need
sperate_arg='--enable_blob_files=true' #rokcsdb的键值分离版本就是原来的版本上加一个参数,所以使用相同路径加一个参数
benchmarks='--benchmarks=fillrandom,stats,readrandom,stats'
volumn='128 512 1024 2048'
num='5 10'
echo "test start" >> ${receive}
for v in ${volumn}
do
for n in ${num}
do
recordstart r_sperate 1 ${v} 10000000
./${rocksdb_base} ${const_arg} ${rocksdb_arg} --num=$((${n}*1000000)) --value_size=${v} ${benchmarks} ${sperate_arg} >> ${receive}
recordend
recordstart r_split 1 ${v} 10000000
./${rocksdb_split} ${const_arg} ${rocksdb_arg} --num=$((${n}*1000000)) --value_size=${v} ${benchmarks} >> ${receive}
recordend
recordstart wisckey 1 ${v} 10000000
./${wisckey} ${const_arg} --num=$((${n}*1000000)) --value_size=${v} ${benchmarks} >> ${receive}
recordend
done
done
echo "all done" >> ${receive}
echo "run over \n file in attach" | mutt -s "Test run over" renjc0816@qq.com -a ${receive}
自动发送邮件
mail如何添加附件没整成功,现在使用mutt命令实现,控制台执行:
sudo apt-get install mutt
安装
echo "Body : run over \n file in attach" | mutt -s "Test run over" renjc0816@qq.com -a 'path'
即可。
其中,"Body"开头的是邮件内容,-s
后面的是邮件标题,-a
后面的'path'
是附件地址,正常使用不用带单引号,写在脚本里时可以用之前创建的${receive}
代替。邮件是立刻发送的,收件箱里找不到请到垃圾箱里面找找。如下:
自动解析实验结果生成excel表格
这个程序自己写去
如何生成excel可读取的文件?csv文件
:csv文件可以被excel读取,第一行表示excel的那个列名,用逗号分割,底下的数据也是,每一行代表excel表格内的一行,每一列的内容用逗号分割,英文的逗号。
至于解析实验结果,就逐行读取,然后捕捉自己想要的关键词就行了,性能啥的就不用考虑优化了,咋简单咋来。
下面的是自用的解析rocksdb的参数的,仅供参考
自用rocksdb参数解析(已折叠,可展开)
#include <iostream>
#include <string>
#include <sstream>
#include <vector>
#include <fstream>
#include <iomanip>
#define default_file_path "E:\\Code\\Windows\\FileOperate\\easy-test.txt"
#define resault_file_name "E:\\Code\\Windows\\FileOperate\\resault.csv"
using namespace std;
struct arguments {
arguments(string s,string t):name(s),data(t){}
string name;
string data;
};
void readFile(vector<arguments>& resault,const string& file_path);
void trimEmpty(string &s);//用于去除字符串首尾空格
void recordString(const string& type, string& s,vector<arguments>& resault);//用于格式化并记录data
void recordInFile(const vector<arguments>& resault);//解析结果记录到文件中,测试用
void recordCSVMode(const vector<arguments>& resault);
void printInShell(const vector<arguments>& resault);//打印到控制台,测试用
//按顺序存放需要捕捉的关键词,问题在于只能顺序
//如果该行以该关键词结尾,那么就将所有的东西记录下来
//注意,这个数组并不是最终参数结果,有的一行记了两三个参数
const static vector<string> key_words = {"db_name","thread_num","start_time","Values","Entries","RawSize","FileSize",
"fillrandom","Cumulative compaction","Cumulative writes","Cumulative stall",
"readrandom","Cumulative compaction","Cumulative writes","Cumulative stall","done_time"};
const static int length = key_words.size();
int main(int arg_count, char *arg_value[]){
string file_path = default_file_path; //默认路径
if(arg_count > 1) file_path = arg_value[1];
//argv[0]为程序名,这点由shell传统决定,argv[1]是程序名的输入
vector<arguments> resault;
readFile(resault,file_path);
// printInShell(resault);
// recordInFile(resault);
recordCSVMode(resault);
// getchar();
return 0;
}
void readFile(vector<arguments>& resault,const string& file_path){
int flag = 0;
string line;//按行读取
ifstream fp(file_path);
while(getline(fp, line)) {
string head = line.substr(0,line.find(":"));
trimEmpty(head);
if(key_words[flag] == head) {
string tail = line.substr(line.find(":")+1);
recordString(key_words[flag],tail,resault);
// resault.push_back(arguments(key_words[flag],tail));
flag = flag == length - 1 ? 0 : flag + 1;
}
}
}
void trimEmpty(string &s){
//删除字符串的前后空格
if (!s.empty()){
s.erase(0, s.find_first_not_of(" "));
s.erase(s.find_last_not_of(" ") + 1);
}
}
void recordString(const string& type, string& s,vector<arguments>& resault){
//为什么不使用精确的下表标位置
//因为数据的长度不一定,所以必须使用标点符号等来相对定位。
trimEmpty(s);
if(type == "fillrandom" || type == "readrandom"){
int start = s.find("op")+3;
int len = s.find(";") - start;
string kops = s.substr(start,len);
resault.push_back(arguments("Kops",kops));
start = s.find(";")+1;
len = s.find_last_of("s")+1 - start;
s = s.substr(start,len);
trimEmpty(s);
resault.push_back(arguments("Speed",s));
return;
}
if(type == "Cumulative stall") {
string stall_time = s.substr(0,s.find(" "));
resault.push_back(arguments("Cumulative stall",stall_time));
s = s.substr(s.find(",") + 2);
resault.push_back(arguments("Average stall",s));
return;
}
if(type == "start_time" || type == "done_time"){
s = s.substr(s.find_last_of(":")-5,8);
}else if(type == "Values"){
s = s.substr(0,s.find(" "));
}else if(type == "RawSize" || type == "FileSize"){
s = s.substr(0,s.find_last_of(" "));
}else if(type == "Cumulative compaction"){
s = s.substr(0,s.find(" ")+3);
}else if(type == "Cumulative writes"){
int start = s.find_last_of(":") + 2;
int length = s.find_last_of(",") - start;
s = s.substr(start,length);
}
resault.push_back(arguments(type,s));
return;
}
void recordInFile(const vector<arguments>& resault){
ofstream record;
remove(resault_file_name);
record.open(resault_file_name, ios::app);
for (size_t i = 0; i < resault.size(); i++) {
record << left << setw(25) << setfill(' ') << resault[i].name;
record << resault[i].data << endl;
}
}
void recordCSVMode(const vector<arguments>& resault){
//key_words的长度并不是最终参数的数量
ofstream record;
remove(resault_file_name);
record.open(resault_file_name, ios::app);
size_t point = 0,point_t = 0;
string head = resault[0].name;
while(resault[point+1].name != head){
record << resault[point++].name << ",";
}
record << resault[point].name << endl;
for (size_t i = 0; i < resault.size(); i++) {
if(point_t < point) {
++point_t;
record << resault[i].data << ",";
} else {
point_t = 0;
record << resault[i].data << endl;
}
}
}
void printInShell(const vector<arguments>& resault){
// 格式化输出,left表示偏左,setw是设置宽度,stefill是设置填充字符
for (size_t i = 0; i < resault.size(); i++) {
cout << left << setw(25) << setfill(' ') << resault[i].name;
cout << resault[i].data << endl;
}
}
解析结果如下(这个花花绿绿的颜色是vscode的插件,创建csv文件之后就会提示安装)
excel可以直接打开,wps没下就没试。excel打开如下:
刚打开可能数据显得有点拥挤,可以另存为excel正常的格式进行调整,要不然调整了这csv文件也保存不下来的。
好了,这波整完就可以开始摸鱼啦把实验放那跑,跑完手机会收到邮件提示,回去自动解析一波就行,至于更多的分类啥的功能,都可以在程序中实现。
(>.o)