小 K 不慎被 LL 邪教洗脑了,洗脑程度深到他甚至想要从亚瑟王邪教中脱坑。他决定,在脱坑之前,最后再来打一盘亚瑟王。既然是最后一战,就一定要打得漂亮。众所周知,亚瑟王是一个看脸的游戏,技能的发动都是看概率的。
作为一个非洲人,同时作为一个前 OIer,小 K 自然是希望最大化造成伤害的期望值。但他已经多年没写过代码,连 Spaly都敲不对了,因此,希望你能帮帮小 K,让他感受一下当欧洲人是怎样的体验。
本题中我们将考虑游戏的一个简化版模型。 玩家有一套卡牌,共 n张。游戏时,玩家将 n 张卡牌排列成某种顺序,排列后将卡牌按从前往后依次编号为 1 ~ n。本题中,顺序已经确定,即为输入的顺序。每张卡牌都有一个技能。第 i 张卡牌的技能发动概率为 pi,如果成功发动,则会对敌方造成di点伤害。也只有通过发动技能,卡牌才能对敌方造成伤害。基于现实因素以及小K非洲血统的考虑,pi不会为 0,也不会为 1,即 0 < pi < 1。 一局游戏一共有 r 轮。在每一轮中,系统将从第一张卡牌开始,按照顺序依次考虑每张卡牌。在一轮中,对于依次考虑的每一张卡牌:
1如果这张卡牌在这一局游戏中已经发动过技能,则
1.1 如果这张卡牌不是最后一张,则跳过之(考虑下一张卡牌); 否则(是最后一张),结束这一轮游戏。
2否则(这张卡牌在这一局游戏中没有发动过技能),设这张卡牌为第 i 张
2.1将其以 pi的概率发动技能。
2.2如果技能发动,则对敌方造成 di点伤害,并结束这一轮。
2.3如果这张卡牌已经是最后一张(即 i 等于n),则结束这一轮;否则,考虑下一张卡牌。
请帮助小 K 求出这一套卡牌在一局游戏中能造成的伤害的期望值。
输入文件的第一行包含一个整数 T,代表测试数据组数。 接下来一共 T 组数据。 每组数据的第一行包含两个用空格分开的整数 n和r,分别代表卡牌的张数和游戏的轮数。 接下来 n行,每行包含一个实数和一个整数,由空格隔开,描述一张卡牌。第i 行的两个数为 pi和 di,分别代表第 i 张卡牌技能发动的概率(实数)和技能发动造成的伤害(整数)。保证 pi最多包含 4位小数,且为一个合法的概率。
对于每组数据,输出一行,包含一个实数,为这套卡牌在这一局游戏中造成的伤害的期望值。对于每一行输出,只有当你的输出和标准答案的相对误差不超过10^-8时——即|a-o|/a<=10-8时(其中a是标准答案,o是输出),你的输出才会被判为正确。建议输出10 位小数。
1
3 2
0.5000 2
0.3000 3
0.9000 1
3.2660250000
一共有 13 种可能的情况:
第一轮中,第 1张卡牌发动技能;第二轮中,第 2张卡牌发动技能;
概率为 0.15,伤害为5。
第一轮中,第 1张卡牌发动技能;第二轮中,第 3张卡牌发动技能;
概率为 0.315,伤害为3。
第一轮中,第 1张卡牌发动技能;第二轮不发动技能;
概率为 0.035,伤害为2。
第一轮中,第 2张卡牌发动技能;第二轮中,第 1张卡牌发动技能;
概率为 0.075,伤害为5。
第一轮中,第 2张卡牌发动技能;第二轮中,第 3张卡牌发动技能;
概率为 0.0675,伤害为4。
第一轮中,第 2张卡牌发动技能;第二轮不发动技能;
概率为 0.0075,伤害为3。
第一轮中,第 3张卡牌发动技能;第二轮中,第 1张卡牌发动技能;
概率为 0.1575,伤害为3。
第一轮中,第 3张卡牌发动技能;第二轮中,第 2张卡牌发动技能;
概率为 0.04725,伤害为4。
第一轮中,第 3张卡牌发动技能;第二轮不发动技能;
概率为 0.11025,伤害为1。
第一轮不发动技能;第二轮中,第 1张卡牌发动技能;
概率为 0.0175,伤害为2。
第一轮不发动技能;第二轮中,第 2张卡牌发动技能;
概率为 0.00525,伤害为3。
第一轮不发动技能;第二轮中,第 3张卡牌发动技能;
概率为 0.011025,伤害为1。
第一轮不发动技能;第二轮亦不发动技能;
概率为 0.001225,伤害为0。
造成伤害的期望值为概率与对应伤害乘积之和,为 3.266025。
对于所有测试数据, 1 <= T <= 444, 1 <= n <= 220, 0 <= r <= 132, 0 < pi < 1, 0 <= di <= 1000。
除非备注中有特殊说明,数据中 pi与di均为随机生成。
请注意可能存在的实数精度问题,并采取适当措施。
【spj】
https://www.luogu.org/problemnew/solution/P3239
第一篇题解,写的蛮好
转载侵删。
如果能够求出每张卡牌在所有\(r\) 轮中被发动的概率\(g[]\) ,那么答案显然为:
\(\sum_{i=1}^ng[i]d[i]\)
第一步推出,\(g[1]=1-(1-p[1])^r\)。
再考虑第二张:
情况一:如果第\(1\) 张牌没有发动过技能,那么第\(2\) 张牌发动技能的概率为\(1-(1-p[2])^r\)。
情况二:如果第\(1\) 张牌发动过\(1\)次技能,那么在\(1\)张牌发动技能的那一轮,第\(2\)张牌绝对不会再发动技能了,因此第\(2\) 张牌发动技能的概率为\(1-(1-p[2])^{r-1}\)。
结合这个例子,可以得到,对于任意的\(i>1\),在第1 张牌到第\(i?1\)张牌在所有\(r\) 轮内是否发动技能已经确定的情况下,第\(i\)张牌被发动技能的概率只取决于第\(1\) 张牌到第\(i?1\) 张牌中有多少张发动了技能。即如果有\(j\) 张发动了技能,那么在此情况下第\(i\) 张牌发动技能的概率为\(1-(1-p[i])^{r-j}\) 。
根据这个性质,就能想到一个DP模型:
\(f[i][j]\)表示前\(i\) 张牌中,恰好有\(j\) 张在所有\(r\)轮中被发动过的概率。
转移就比较好想了。分第iii 张牌发动与不发动两种情况:
1:发动。那么前\(i?1\) 张牌一定有\(j?1\)张牌被发动技能,因此对于第\(i\) 张牌,在\(r\) 轮中有\(j?1\) 轮已经不会再发动技能了。所以:
\(f[i][j]+=(1-(1-p[i])^{r-j+1})f[i-1][j-1]\)
2:不发动。那么前\(i?1\) 张牌中一定有\(j\) 张牌被发动技能,因此对于第\(i\) 张牌,在\(r\)轮中有\(j\) 轮是绝对不会再发动技能的。所以:
\(f[i][j]+=(1-p[i])^{r-j}f[i-1][j]\)
因此,完整的转移方程为:
\(f[i][j]=((1-(1-p[i])^{r-j+1})f[i-1][j-1])[j>0]\)
\(+((1-p[i])^{r-j}f[i-1][j])[i\neq j]\)
那么求\(g\) 就更容易了:
\(g[i]=\sum_{j=0}^{\min(i-1,r)}(1-(1-p[i])^{r-j})f[i-1][j]\)
代码:
#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <algorithm>
#include <queue>
#include <vector>
inline int max(int a, int b){return a > b ? a : b;}
inline int min(int a, int b){return a < b ? a : b;}
inline void swap(int &x, int &y){int tmp = x;x = y;y = tmp;}
inline void read(int &x)
{
x = 0;char ch = getchar(), c = ch;
while(ch < '0' || ch > '9') c = ch, ch = getchar();
while(ch <= '9' && ch >= '0') x = x * 10 + ch - '0', ch = getchar();
if(c == '-') x = -x;
}
const int INF = 0x3f3f3f3f;
const int MAXN = 220 + 5;
const int MAXR = 132 + 5;
int t, n, r, d[MAXN];
double p[MAXN], g[MAXN], dp[MAXN][MAXN], pow[MAXN][MAXR], ans;
/*
dp[i][j]表示前i个,在r轮中有j个发动了的概率
*/
int main()
{
freopen("data.txt", "r", stdin);
read(t);
for(;t;-- t)
{
read(n), read(r), dp[0][0] = 1, ans = 0;
for(int i = 1;i <= n;++ i) pow[i][0] = 1;
for(int i = 1;i <= n;++ i)
{
scanf("%lf", &p[i]);read(d[i]);
for(int j = 1;j <= r;++ j)
pow[i][j] = pow[i][j - 1] * (1.0 - p[i]);
}
for(int i = 1;i <= n;++ i)
for(int j = min(r, i);j >= 0;-- j)
{
if(j > 0) dp[i][j] += dp[i - 1][j - 1] * (1.0 - pow[i][r - j + 1]);
if(i != j) dp[i][j] += dp[i - 1][j] * pow[i][r - j];
}
for(int i = 1;i <= n;++ i)
for(int j = min(r - 1, i - 1);j >= 0;-- j)
g[i] += dp[i - 1][j] * (1.0 - pow[i][r - j]);
for(int i = 1;i <= n;++ i) ans += g[i] * d[i];
printf("%.10lf\n", ans);
}
return 0;
}
原文:https://www.cnblogs.com/huibixiaoxing/p/8830296.html