XXX: distribution test
[perl/list-index.git] / t / 10-ranges.t
1 #!/usr/bin/env perl
2 use strict;
3 use warnings;
4
5 use Test::More tests => 8;
6 use Test::NoWarnings;
7 use Data::Dump 'pp';
8
9 BEGIN { use_ok('List::Index'); }
10 ok(eval { List::Index->VERSION(1) }, 'version 1.00 compatibility');
11
12 subtest 'single-char alphabet' => sub {
13         plan tests => 4;
14         my @uniform = 'a'..'z';
15         my $index = List::Index->new(\@uniform) or return;
16         is_deeply(\@uniform, ['a'..'z'], 'original data unaltered');
17         is_deeply($index->ranges, ['-'], 'single page');
18         is_deeply($index->ranges({pages => 3}), [qw(-i j-q r-)], 'given pages');
19         is_deeply($index->ranges({pagesize => @uniform / 2.1}), [qw(
20                 -i j-q r-
21         )], 'equivalent pagesize');
22 };
23
24 subtest 'uniform alphanumeric' => sub {
25         plan tests => 2;
26         my $index = List::Index->new(['aa'..'zz', 1..202]) or return;
27         is_deeply($index->ranges, [qw(
28                 -.
29                 .-bp bq-dm dn-fi fj-hf hg-i j-k l-m n-os ot-qp qq-sm sn-uj uk-wf wg-x y-
30
31         )], 'default ranges');
32         is_deeply($index->ranges({pagesize => 300}), [qw(-c d-n o-)], 'large pagesize');
33 };
34
35 subtest 'context' => sub {
36         plan tests => 9;
37         my $index = List::Index->new([qw(
38                 kkeg kl km kmlu knsy    koxb kpeo kuaa kuab kuac
39                 kuapa kuq kur kux kzb   lc lg lgu lgua lguc
40                 lguq lgur lgus lgx lka  lkq lks lln llq llx
41         )]) or return;
42         is_deeply(
43                 $index->ranges({ pagesize=>10, context=>0, length=>5 }),
44                 # ranges should match offsets exactly
45                 [qw(-kuap. kuapa-lgup lguq-)],
46                 'no context'
47         );
48         is_deeply(
49                 $index->ranges({ pagesize=>10, context=>0 }),
50                 # default length limits to 4 chars
51                 [qw(-kuao kuap-lgup lguq-)],
52                 'default length'
53         );
54         is_deeply(
55                 $index->ranges({ pagesize=>10, context=>1 }),
56                 # lookbehinds aren't shorter (kuac<kuap, lguc<lguq)
57                 # 'kuap' can advance to 'kuq'
58                 [qw(-kup kuq-lgup lguq-)],
59                 'lookahead'
60         );
61 TODO: {
62         local $TODO = 'backtrack';
63         is_deeply(
64                 $index->ranges({ pagesize=>10, context=>2 }),
65                 # allowed to advance to 'kur', but provides no benefits over 'kuq'
66                 [qw(-kup kuq-lgup lguq-)],
67                 'minimal lookahead'
68         );
69 }
70         is_deeply(
71                 $index->ranges({ pagesize=>10, context=>3 }),
72                 # shorten 'kuap' to 'ku' because lookbehind is 'kp...'
73                 # 'lguq' matches 'lg', but may only backtrack to 'lgu'
74                 [qw(-kt ku-lgt lgu-)],
75                 'lookbehind'
76         );
77         is_deeply(
78                 $index->ranges({ pagesize=>10, context=>4 }),
79                 [qw(-kt ku-lf lg-)],
80                 'maximal lookahead'
81         );
82         is_deeply(
83                 $index->ranges({ pagesize=>10, context=>5 }),
84                 # after forwarding 'kuap' to 'lc'
85                 # disallow backtracking of 'lguq' to 'lc' to prevent qw[-k l-]
86                 # so only lookahead (to 'lkq') remains
87                 [qw(-k l-lj lk-)],
88                 'lookbehind forbidden'
89         );
90         is_deeply(
91                 $index->ranges({ pagesize=>10, context=>9 }),
92                 # allow a single (10-9) entry (l-lf = lc) to remain
93                 [qw(-k l-lf lg-)],
94                 'lookbehind penalty'
95         );
96         is_deeply(
97                 $index->ranges({ pagesize=>10, context=>10 }),
98                 # allow the last page to go back upto 'lc', replacing the 2nd page
99                 [qw(-k l-)],
100                 'full overlap'
101         );
102 };
103
104 subtest 'distribution' => sub {
105         plan tests => 2;
106         my $index = List::Index->new([qw(
107                 gnihka gniub go gsearnrqns gtdvcxyt gw gwoufolwcvmtueyg gysgphci h habkdgifjfxoh
108                 hbbvjf hbqleexnqts hccg hd hdoeqwdmgqwaoya hfbegicieuxz hfm hj hkoysmws hmylu
109                 hnvtvpievbdlkrmb hs hvdvcqn hvn hyrybeur iaiaab ib ibavqyar idfniqvxpohbk idh
110         )]) or return;
111         is_deeply(
112                 $index->ranges({ pagesize=>10, context=>6 }),
113                 [qw(-g h i-)],
114                 'large context'
115         );
116 { local $TODO = '?';
117         is_deeply(
118                 $index->ranges({ pagesize=>10, context=>5 }),
119                 # after 2nd page is enlarged by lookbehind to 'h', limit subsequent lookahead
120                 # to prevent the page from getting too large (17 entries if forwarded to 'i')
121                 [qw(-g h-hm hn-)],
122                 'lookahead penalty'
123         );
124         # page #14 [gn-g] (8): gnihka gniub go gsearnrqns gtdvcxyt gwawkvmueovdjtfj gwoufolwcvmtueyg gysgphci
125         # page #15 [h] (17): h habkdgifjfxoh hbbvjf hbqleexnqts hccgszftbaymfu hdaqzkow hdoeqwdmgqwaoya hfbegicieu hfmlpzzioqjbthz hj hkoysmws hmylu hnvtvpievbdlkrmb hsodfpkatk hvdvcqn hvn hyrybeurqtevjfmi
126         # page #16 [i-ie] (5): i iaab ibiavqyar idfniqvxpohbk idh
127 }
128 };
129
130 subtest 'context' => sub {
131         plan tests => 4;
132         my $index = List::Index->new([qw(
133                 baa1 baa2  baa3 baaa  bbc cbc  daaa ea  eaaa zed
134         )]) or return;
135         is_deeply($index->ranges({pagesize => 2, context => 0}), [
136                 qw(-baa. baa.-bbb bbc-daa. daaa-eaa. eaaa-)
137         ], 'no context');
138         is_deeply($index->ranges({pagesize => 2}), [
139                 qw(-a b c d e-)
140         ], 'default context');  # context should be 1
141         is_deeply($index->ranges({pagesize => 2, context => 2}), [
142                 qw(-a b-c d e-)
143         ], 'overlap');  # first item equals second due to large context
144         is_deeply($index->ranges({pagesize => 2, context => 0, length => 1}), [
145                 qw(-a b-c d e-)
146         ], 'single char');
147
148         #pp($index->ranges({pagesize => 2, context => 2, length => 1}));
149 };
150