“离散程度”统计在供水压力分析中的应用

 新闻资讯     |      2014-12-29 17:55:27
    “离散程度”是一个数学概念,即观测变量各个取值之间的差异程度。它的意义在于统计变量之间的差异大小。可用来测度观测变量值之间差异程度的指标有很多,在统计分析推断中最常用的主要有极差、平均差和标准差等几种。 本文主要探讨前面两种指标。
    1、极差
    极差又称全距,是观测变量的最大取值与最小取值之间的离差,也就是观测变量的最大观测值与最小观测值之间的区间跨度。极差的计算公式为: 
    R = Max(xi) − Min(xi)
    2、平均差
    平均差是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。
    这两个概念跟离散程度有什么关系呢?假设有一组数据用公式“(最大值-最小值)/平均值”进行统计计算,那么得出的结果就是这组数据的离散程度了。把这个公式拿来对十个压力点进行计算,将得出如下结果:

位置时间

汇文中学

学府雅苑

项王小区

运河四桥

香格里拉

双庄街东

三鼎集团

可成科技

金玉花园

科苑路处

00:00

0.372

0.347

0.344

0.387

0.338

0.364

0.344

0.370

0.282

0.375

01:00

0.373

0.349

0.347

0.388

0.340

0.367

0.348

0.375

0.284

0.380

02:00

0.368

0.347

0.344

0.383

0.338

0.367

0.346

0.374

0.282

0.380

03:00

0.367

0.348

0.346

0.381

0.342

0.367

0.353

0.378

0.283

0.384

04:00

0.377

0.358

0.366

0.391

0.362

0.376

0.375

0.385

0.296

0.391

05:00

0.383

0.366

0.374

0.398

0.369

0.393

0.389

0.413

0.303

0.417

06:00

0.373

0.350

0.347

0.396

0.346

0.391

0.375

0.425

0.286

0.430

07:00

0.352

0.324

0.312

0.379

0.319

0.371

0.385

0.421

0.259

0.428

08:00

0.341

0.319

0.302

0.375

0.309

0.363

0.371

0.414

0.251

0.418

09:00

0.336

0.315

0.297

0.368

0.304

0.359

0.363

0.404

0.246

0.409

10:00

0.336

0.310

0.282

0.370

0.288

0.353

0.321

0.396

0.237

0.403

11:00

0.342

0.315

0.290

0.373

0.295

0.358

0.332

0.405

0.242

0.411

12:00

0.351

0.309

0.284

0.375

0.291

0.355

0.330

0.400

0.239

0.405

13:00

0.349

0.321

0.299

0.370

0.303

0.360

0.335

0.399

0.250

0.405

14:00

0.349

0.333

0.317

0.372

0.318

0.369

0.348

0.407

0.263

0.412

15:00

0.351

0.330

0.314

0.373

0.316

0.368

0.343

0.399

0.261

0.405

16:00

0.350

0.330

0.313

0.371

0.315

0.373

0.343

0.404

0.260

0.409

17:00

0.345

0.327

0.308

0.371

0.313

0.369

0.344

0.410

0.256

0.415

18:00

0.352

0.328

0.308

0.375

0.313

0.375

0.348

0.416

0.256

0.421

19:00

0.353

0.330

0.311

0.374

0.315

0.377

0.352

0.416

0.258

0.422

20:00

0.353

0.329

0.313

0.374

0.318

0.380

0.355

0.420

0.258

0.426

21:00

0.360

0.334

0.319

0.380

0.323

0.382

0.357

0.418

0.263

0.423

22:00

0.367

0.343

0.339

0.385

0.341

0.388

0.374

0.424

0.277

0.429

23:00

0.378

0.351

0.353

0.394

0.351

0.369

0.366

0.385

0.289

0.389

离散程度

0.131

0.171

0.284

0.079

0.253

0.108

0.192

0.137

0.247

0.135

    从上表我们可以看出,离散程度的数值越小,该压力点的压力变化也就越小。那么在标准条件下(出口压力设置不变,用户用水量时间段分布不变,天气状况不变),压力点的离散程度是不是也应该是不变的呢?由于不可能存在以上假设,只能直接选择工作日条件下,近似天气状况来对以上压力点的离散程度进行统计,得出如下的结果:

 

121

122

123

124

125

平均离  散程度

汇文中学

0.143

0.131

0.101

0.108

0.110

0.119

学府雅苑

0.196

0.171

0.149

0.165

0.246

0.186

项王小区

0.285

0.284

0.247

0.294

0.313

0.284

运河四桥

0.122

0.079

0.065

0.075

0.086

0.085

香格里拉

0.208

0.253

0.219

0.260

0.298

0.247

双庄街东

0.152

0.108

0.102

0.118

0.241

0.144

三鼎集团

0.206

0.192

0.168

0.208

0.228

0.200

可成科技

0.154

0.137

0.132

0.131

0.224

0.156

金玉花园

0.212

0.247

0.220

0.256

0.272

0.241

科苑路处

0.155

0.135

0.133

0.129

0.226

0.156

    其变化曲线如下:

    从表格和变化曲线图可以看出:
    各压力点的离散程度变化不是太大,而且有意思的是,地理位置临近的压力点,其离散程度变化趋势也是近似的。如学府雅苑跟双庄街东,汇文中学跟运河四桥等,完全符合实际情况,这也就证明了离散程度对于压力点是否稳定是有参考意义的。它还有一个作用,当离散程度计算结果远远大于平时的值时,我们就可以考虑是现场出现漏损还是设备异常。
    但我们也应该看到离散程度分析的弊端,它需要很多标准条件。而且我采用的离散程度计算公式的分母,是绝对平均值。而不是中位数。中位数是指将一组数值从大到小排列,处在中间位置的数字。此外,如果数值项为偶数,则处在中间位置的两个数的平均值就是中位数。使用中位数作为离散程度的参考值时可以精确计算极大数和极小数的影响。比如有一组值为(0,5,10,95),按照之前的公式计算它的离散程度为(95-0)/(0+5+10+95)/4≈3.45 而按照中位数作为参考的的话,离散程度为(95-0)/(5+10)/2≈12.67,由此可见,采用中位数作为参考值,计算出来的离散程度更符合现实情况。但其也有缺点就是需要将数值从大到小排列,然后找中间位置,不符合便捷性的要求。
    综上所述:在相关条件变化不大的情况下,统计压力监测点的离散程度,确实能客观反映压力点的稳定情况。如果在大量的基础数据支持下,通过不断的修正计算公式,那么我们就可以为调度工作做参考,甚至对压力监测设备的维护工作具有指导意义。
(调度中心  邱石磊)