A Baremetal Test Framework for RISC-V
本repo是本人研一期间实验室科研项目的软件代码部分(硬件代码不便公开),项目的部分报告成果如下
此处为缩略图,点击查看完整版PDF报告
此处为缩略图,点击查看完整版PDF报告
将C代码直接编译为UniCore32二进制并链接到RISC-V程序中
- 目前Uni-ld只支持无外部链接(包括库函数、运行时)和系统调用的C代码,故不能使用
printf
,也不能包含不可强度消减的/
、%
运算 - 你可以在代码中写多个函数,但需要指定一个入口函数,Uni-ld将从入口函数开始执行,并返回入口函数的结果
- 入口函数的示例如下,必须无参数,并且返回类型为
int
int my_entry() { ... return res; }
- 建议将全局数据和非入口函数都标为
static
,避免和RISC-V主程序冲突 bench/
中已经提供了数个样例程序供参考,下面的教程将基于bench/bubble.c
- 用unicore工具链生成可重定向文件
$ unicore32-linux-gcc -std=c99 -O1 -c bench/bubble.c -o bubble.o
- 确认无库函数和运行时调用
$ unicore32-linux-objdump -D bubble.o # 检查反汇编代码 $ unicore32-linux-readelf -r bubble.o # 检查重定位表
- 用
unild
生成RISC-V可执行文件$ ./unild bubble.o -e do_bubble -o bubble
-e
:指定入口函数,因为bubble.c
中有两个函数,必须显式指定入口函数;若只有一个函数则无需指定- 注:
unild
需要调用riscv64-unknown-elf-gcc
,你可以在chipyard-slim
容器中运行 - 注:
unild
依赖于barebear
的库,故必须在barebear
目录下执行
- 在本机架构下运行,得到参考结果
$ gcc bench/bubble.c -DWITH_MAIN -o bubble_ref && ./bubble_ref # code = 4
- 在BOOM中运行(请正确设置运行目录)
$ <boom_split>/build/simulator-MediumUniCoreConfig <barebear>/bubble # This emulator compiled with JTAG Remote Bitbang client. To enable, use +jtag_rbb_enable=1. # Listening on port 41121 # [UART] UART0 is here (stdin/stdout). # *** FAILED *** (code = 4, seed 1646491743) after 997647 cycles
- 注:结果为
code = 4
,和上面相同,说明运行正确
- 注:结果为
- Uni-ld支持通过返回值获取RISC-V CSR性能计数器的值,且支持设置预热轮数,例如
$ ./unild kmp.o -e do_kmp -o kmp --warmup 3 --hpm-counter mcycle
--warmup
:先预热运行warmup
次do_kmp
,再正式运行1次do_kmp
;预热运行与正式运行实际上并无差别--hpm-counter
:统计并返回正式运行时该计数器的值(增量);RISC-V默认提供mcycle
和minstret
两个计数器,如有需要可在mhpmcounter{3-31}
上扩展- 注:请确保你的程序每次执行的内容都是相同的;例如,如果你的程序是排序,请确保每次排序的数组都是相同的,否则可能得到错误的结果
- 使用上述方法链接的程序执行方法与普通程序无异,除了返回值变为性能计数器的值,例如
$ <boom_split>/build/simulator-MediumUniCoreConfig <barebear>/kmp # This emulator compiled with JTAG Remote Bitbang client. To enable, use +jtag_rbb_enable=1. # Listening on port 38671 # [UART] UART0 is here (stdin/stdout). # *** FAILED *** (code = 30796, seed 1645908901) after 1201529 cycles
- 容易知道,性能计数器的值为30796
- 注:由于开启
--hpm-counter
选项后无法得知程序本身的返回值,建议先只开--warmup
确认返回值无误后再开--hpm-counter
- 开启
-v
选项获取关于重定位的详细信息,例如$ ./unild matmul.o -e do_matmul -o matmul -v # debug: Accept section '.text' # debug: Accept section '.data' # debug: Accept section '.bss' # debug: Relocate ABS32 0x00003164 (.text+0x124) to 0x80004000 (.data+0x1000) # debug: Relocate ABS32 0x00003168 (.text+0x128) to 0x80005010 (.bss+0x0) # debug: Relocate ABS32 0x0000316c (.text+0x12c) to 0x80003000 (.data+0x0)
- Uni-ld不保证支持所有的重定位方式,你可以从这里发现问题,完善和扩展Uni-ld
在baremetal模式下读RISC-V CSR寄存器
- 参考
readcsr_bm.c
中的调用方式和bench/
中的小程序准备你的benchmark - 注:你只能读已经定义的CSR,否则会发生异常,即你需要将多余的
__csrr_hpmcounter
指令注释掉 - 下面以
bench/
中已有的benchmark为例
- 开启浮点
$ riscv64-unknown-elf-gcc -march=rv64g -mabi=lp64d -mcmodel=medany \ -I. -O3 -nostdlib -nostartfiles -Tlink.ld \ -o readcsr_bm readcsr_bm.c bench/*.c lib/crt.S lib/*.c
- 注:若你的benchmark中有浮点运算,请务必使用该选项
- 禁用浮点
$ riscv64-unknown-elf-gcc -march=rv64g -mabi=lp64 -mcmodel=medany \ -I. -O3 -nostdlib -nostartfiles -Tlink.ld \ -DPRINTF_DISABLE_SUPPORT_FLOAT -DBAREBEAR_DISABLE_FS \ -o readcsr_bm readcsr_bm.c bench/*.c lib/crt.S lib/*.c
- 关于
-march
和-mabi
设置的更多细节请见SiFive Blog
$ <boom_home>/simulator-MediumBoomConfig <barebear>/readcsr_bm
# This emulator compiled with JTAG Remote Bitbang client. To enable, use +jtag_rbb_enable=1.
# Listening on port 38551
# [UART] UART0 is here (stdin/stdout).
# begin
# "do_qsort": {
# "cycle" : 167355,
# "instret" : 126630,
# ...
# "br_loop_flip" : 53,
# "br_loop_flip_misp" : 24
# }
# "do_matmul": {
# "cycle" : 106092,
# "instret" : 183146,
# ...
# "br_loop_flip" : 50,
# "br_loop_flip_misp" : 0
# }
# ...
在Linux环境下定时读RISC-V CSR寄存器
- 自行准备一个可以运行的程序,这里以
gcc_base.rv64
为例 - 如果要确认程序的正确性,请先单独运行该程序;套上
runcsr
后它的输出和返回值将难以获取$ ./gcc_base.rv64 166.i -o 166.s
- 直接编译即可,FPGA上已经有库,无需开
-static
$ riscv64-unknown-linux-gnu-gcc -O3 -o runcsr runcsr.c
- 直接运行,但若benchmark有输出会与
runcsr
的输出混在一起$ ./runcsr ./gcc_base.rv64 166.i -o 166.s 2>output.log
- 注:若
gcc_base.rv64
不在PATH中,务必在前面加上./
,因为runcsr
用的是execvp
系统调用
- 注:若
- 套用
bash
运行,将benchmark的输出屏蔽掉$ ./runcsr bash -c "./gcc_base.rv64 166.i -o 166.s >/dev/null 2>&1" 2>output.log
runcsr
每隔约60秒输出一次,在程序结束时也会输出一次- 输出格式为JSON,一次一行(以
\n
为界),如下所示{"time":0.000020,"hpms":[64853,31771,83,59619,40856,19351,48972,5240,58258,23336,9135,63827,29214,38282,56573,45491]} {"time":60.038576,"hpms":[64968,31879,106,59635,40982,19356,49041,5374,58339,23412,9371,64006,29383,38436,56781,45605]} {"time":120.063710,"hpms":[65156,31885,282,59747,41185,19513,49243,5533,58569,23519,9472,64208,29531,38531,57000,45760]} ...
time
:从runcsr启动开始的时间,秒hpms
:性能计数器的值,具体内容请在runcsr.c
中自行设置;我们需要的即是每两次之间的差值- 注:请务必只读已经定义的CSR,否则会发生异常
- 为了在terminal上及时看到结果,但又为了防止terminal断开导致结果消失,
runcsr
会将结果同时输出到stdout
和stderr
,你应该将其中一个重定向到备份文件
- 代码仅供测试,建议看懂
graphcsr.py
后根据自己的需求写一份 - 需安装Python3和
matplotlib
- 运行如下指令,会在命令行输出总结,同时得到
output-{BrMispRate,BrMPKI,IPC}.png
三张图$ python3 graphcsr.py -g output.log # IPC: 0.7830317206800169 # Br Misp Rate: 0.0454508694335663 # Br MPKI: 2.623381393198754