选取单元格区域A1:D5,单击“图表向导”图标在弹出的“图表类型”对话框中选中股价图的“开盘-盘高-盘低-收盘图”(第2 个子图表类型),按下一步键。
在图表数据源对话框的数据区域中将“系列产生在”修改为“行”,按下一步键。 在“图表选项”对话框的分类(X)轴下方填入“治疗组”,在数值(Y)轴下方填入“最大呼气量(FEV)”,按完成键。
在绘图区点击右键,选取“数据源→系列→添加”,在“名称”右侧用鼠标选取单元格A6,在“值”右侧用鼠标选取单元格区域B6:D6 按确定键。 在网格线上点击右键,“清除”网格线;在绘图区单击右键“清除”背景色。
在横坐标上单击右键,选取“坐标轴格式→图案”,右上部主要刻度线类型复选“无”,按确定键。 在纵坐标上单击右键,选取“坐标轴格式→数字→数值”,小数位数改为“0”,按确定键。
在箱的中心位置P50 系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取“+”,前景颜色处选黑色,“大小”改为6 磅,按确定键;在箱线图的顶部P100系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6 磅,按确定键;在箱线图的底部P0系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6 磅,按确定键。适当调整绘图区的大小,调整整个图表区域的字体大小,去除图表区的边框等,可获得箱线图。
箱线图(Boxplot)也称箱须图(Box-whisker Plot),用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱线图的中心位置为
(第百分之五十位数,P50);中部的“箱”范围为四分位间距(即P75 -
P25 );“箱”两端的“须”一般为最大值与最小值,如果资料两端值变化较大,两端也可采用P99.5与P0.5、P99与P1或P97.5与P2.5。大家可根据数据的波动情况作出选择。
例:某研究者分别采用
、
10mg、
20mg 治疗三个随机分组的阻塞性
病人,每组100 例,治疗两周后测量最大呼气量(forced
expiratory volume,
FEV)。每组测量后计算获得的P100、P75、P50、P25、P0(即最大值、75%
、
、25%
、最小值**)(见下图),试绘制箱线图。
三种方案治疗阻塞性
后的最大呼气量箱线图
绘制箱线图需要借助于股价图中的“开盘-盘高-盘低-收盘图”,该图形需要将数据按一定的顺序排列。因此绘制箱线图时也需要将数据按P25、P100、P0、P50、P75的顺序排列(P25与P75的顺序可对调)。具体绘制步骤如下:
①选取单元格区域A1:D5,单击“图表向导”图标,在弹出的“图表类型”对话框中选中股价图的“开盘-盘高-盘低-收盘图”(第2
个子图表类型),按下一步键。
②在图表
对话框的数据区域中将“系列产生在”修改为“行”,按下一步键。
③在“图表选项”对话框的分类(X)轴下方填入“治疗组”,在数值(Y)轴下方填入“最大呼气量(FEV)”,按完成键。
④在绘图区点击右键,选取“
→系列→添加”,在“名称”右侧用鼠标选取单元格A6,在“值”右侧用鼠标选取单元格区域B6:D6 按确定键。
⑤在
线上点击右键,“清除”
线;在绘图区单击右键“清除”背景色。
⑥在横坐标上单击右键,选取“
格式→图案”,右上部主要刻度线类型复选“无”,按确定键。
⑦在纵坐标上单击右键,选取“
格式→数字→数值”,小数位数改为“0”,按确定键。
⑧在箱的中心位置P50 系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取“+”,前景颜色处选黑色,“大小”改为6
磅,按确定键;在箱线图的顶部P100系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6
磅,按确定键;在箱线图的底部P0系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6
磅,按确定键。
⑨适当调整绘图区的大小,调整整个图表区域的字体大小,去除图表区的边框等,可获得上图右侧的箱线图。
-----------------------------------------------
注**:这五个值可以在Excel中用QUARTILE(array,quart)函数求得。由此处也可知,用Excel作箱线图实际上也是一种间接的方式,并不是像SPSS等软件那样直接生成,从统计的角度来说,更重要的是这种方法不考虑Outliers,所以与其他软件作出来的图可能并不一样。
[编辑]箱线图的绘制步骤
1、画数轴,度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据批的全距稍长。
2、画一个矩形盒,两端边的位置分别对应数据批的上下四分位数(Q1和Q3)。在矩形盒内部中位数(Xm)位置画一条线段为中位线。
3、在Q3+1.5IQR(四分位距)和Q1-1.5IQR处画两条与中位线一样的线段,这两条线段为异常值截断点,称其为内限;在F+3IQR和F-3IQR处画两条线段,称其为外限。处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值(mild outliers),在外限以外的为极端的异常值(extreme outliers)。
4、从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常值的分布区间。
5、用“〇”标出温和的异常值,用“*”标出极端的异常值。相同值的数据点并列标出在同一数据线位置上,不同值的数据点标在不同数据线位置上。至此一批数据的箱线图便绘出了。统计软件绘制的箱线图一般没有标出内限和外限。