我有一个带有列的数据框df:
Date_1 count
01/09/2019 5
02/09/2019 4
03/09/2019 5
04/09/2019 6
05/09/2019 7
06/09/2019 8
07/09/2019 10
08/09/2019 9
09/09/2019 11
10/09/2019 12
11/09/2019 13
12/09/2019 14
13/09/2019 15
14/09/2019 18
15/09/2019 17
16/09/2019 18
17/09/2019 19
18/09/2019 20
19/09/2019 21
20/09/2019 22
21/09/2019 23
22/09/2019 24
23/09/2019 25
24/09/2019 26
25/09/2019 27
26/09/2019 28
27/09/2019 29
28/09/2019 30
29/09/2019 30
30/09/2019 30
我想生成具有3列date_1,count,date_2的df2,例如:
date_2是基于计数生成的。如果date_1的计数为5,则数据框中将有5个条目。而且date_2具有以下约束:
- 其中70%的值在(date_1-10到date_1-2)范围内
- 其余值的范围为(date_1-30到date_1-11)
date_1和date_2的每个也应该是唯一的元组,即,不重复任何对(date_1,date_2)。
例如:
第一行: date_1的4个值应在范围1 =(01/09/2019-10 = 22/08/2019到01/09/2019-30/08/2019)范围内,其余1个值应在范围范围内2(01/09/2019-30 = 02/08/2019至01/09/2019-21/08/2019)。
对于count = 30的数据帧中的值,我们不需要进行此更改,因为我们需要唯一的值,并且由于date_2可以取的总值为30,因此我们必须合并所有值。 (在这种情况下,我们不能使用70%和30%)
我无法理解如何根据这些因素特别设计该数据框。因此,对于count> 11,它的所有值都应在1(8个值)范围内。在此之前,其范围1和范围2分别为70%和30%。
任何人都可以帮助我定义这些约束。
谢谢