3 月之前 · a9da95945d
--- a/core/benches/shredder.rs
+++ b/core/benches/shredder.rs
@@ -10,7 +10,7 @@ use {
 
				     solana_keypair::Keypair,
			
 
				     solana_ledger::shred::{
			
 
				         get_data_shred_bytes_per_batch_typical, max_entries_per_n_shred, max_ticks_per_n_shreds,
			
 
				-        ProcessShredsStats, ReedSolomonCache, Shred, Shredder, DATA_SHREDS_PER_FEC_BLOCK,
			
 
				+        recover, ProcessShredsStats, ReedSolomonCache, Shred, Shredder, DATA_SHREDS_PER_FEC_BLOCK,
			
 
				     },
			
 
				     solana_perf::test_tx,
			
 
				     test::{black_box, Bencher},
			
@@ -192,7 +192,8 @@ fn bench_shredder_decoding(bencher: &mut Bencher) {
 
				         .partition(Shred::is_data);
			
 
				 
			
 
				     bencher.iter(|| {
			
 
				-        let result = Shredder::try_recovery(coding_shreds.clone(), &reed_solomon_cache).unwrap();
			
 
				-        black_box(result);
			
 
				+        for shred in recover(coding_shreds.clone(), &reed_solomon_cache).unwrap() {
			
 
				+            black_box(shred.unwrap());
			
 
				+        }
			
 
				     })
			
 
				 }
			
--- a/ledger/src/shred.rs
+++ b/ledger/src/shred.rs
@@ -402,10 +402,6 @@ impl Shred {
 
				     dispatch!(fn signed_data(&self) -> Result<SignedData, Error>);
			
 
				 
			
 
				     dispatch!(pub fn chained_merkle_root(&self) -> Result<Hash, Error>);
			
 
				-    // Returns the portion of the shred's payload which is erasure coded.
			
 
				-    dispatch!(pub(crate) fn erasure_shard(&self) -> Result<&[u8], Error>);
			
 
				-    // Returns the shard index within the erasure coding set.
			
 
				-    dispatch!(pub(crate) fn erasure_shard_index(&self) -> Result<usize, Error>);
			
 
				     dispatch!(pub(crate) fn retransmitter_signature(&self) -> Result<Signature, Error>);
			
 
				 
			
 
				     dispatch!(pub fn into_payload(self) -> Payload);
			
--- a/ledger/src/shred/shred_code.rs
+++ b/ledger/src/shred/shred_code.rs
@@ -31,8 +31,6 @@ impl ShredCode {
 
				     dispatch!(fn coding_header(&self) -> &CodingShredHeader);
			
 
				 
			
 
				     dispatch!(pub(super) fn common_header(&self) -> &ShredCommonHeader);
			
 
				-    dispatch!(pub(super) fn erasure_shard(&self) -> Result<&[u8], Error>);
			
 
				-    dispatch!(pub(super) fn erasure_shard_index(&self) -> Result<usize, Error>);
			
 
				     dispatch!(pub(super) fn first_coding_index(&self) -> Option<u32>);
			
 
				     dispatch!(pub(super) fn into_payload(self) -> Payload);
			
 
				     dispatch!(pub(super) fn payload(&self) -> &Payload);
			
--- a/ledger/src/shred/shred_data.rs
+++ b/ledger/src/shred/shred_data.rs
@@ -23,8 +23,6 @@ impl ShredData {
 
				     dispatch!(fn data_header(&self) -> &DataShredHeader);
			
 
				 
			
 
				     dispatch!(pub(super) fn common_header(&self) -> &ShredCommonHeader);
			
 
				-    dispatch!(pub(super) fn erasure_shard(&self) -> Result<&[u8], Error>);
			
 
				-    dispatch!(pub(super) fn erasure_shard_index(&self) -> Result<usize, Error>);
			
 
				     dispatch!(pub(super) fn into_payload(self) -> Payload);
			
 
				     dispatch!(pub(super) fn parent(&self) -> Result<Slot, Error>);
			
 
				     dispatch!(pub(super) fn payload(&self) -> &Payload);
			
--- a/ledger/src/shredder.rs
+++ b/ledger/src/shredder.rs
@@ -2,21 +2,15 @@ use {
 
				     crate::shred::{
			
 
				         self, Error, ProcessShredsStats, Shred, ShredData, ShredFlags, DATA_SHREDS_PER_FEC_BLOCK,
			
 
				     },
			
 
				-    itertools::Itertools,
			
 
				     lazy_lru::LruCache,
			
 
				-    rayon::{prelude::*, ThreadPool},
			
 
				-    reed_solomon_erasure::{
			
 
				-        galois_8::ReedSolomon,
			
 
				-        Error::{InvalidIndex, TooFewDataShards, TooFewShardsPresent},
			
 
				-    },
			
 
				+    rayon::ThreadPool,
			
 
				+    reed_solomon_erasure::{galois_8::ReedSolomon, Error::TooFewDataShards},
			
 
				     solana_clock::Slot,
			
 
				     solana_entry::entry::Entry,
			
 
				     solana_hash::Hash,
			
 
				     solana_keypair::Keypair,
			
 
				-    solana_measure::measure::Measure,
			
 
				     solana_rayon_threadlimit::get_thread_count,
			
 
				     std::{
			
 
				-        borrow::Borrow,
			
 
				         fmt::Debug,
			
 
				         sync::{Arc, OnceLock, RwLock},
			
 
				         time::Instant,
			
@@ -31,15 +25,6 @@ static PAR_THREAD_POOL: std::sync::LazyLock<ThreadPool> = std::sync::LazyLock::n
 
				         .unwrap()
			
 
				 });
			
 
				 
			
 
				-// Maps number of data shreds to the optimal erasure batch size which has the
			
 
				-// same recovery probabilities as a 32:32 erasure batch.
			
 
				-pub(crate) const ERASURE_BATCH_SIZE: [usize; 33] = [
			
 
				-    0, 18, 20, 22, 23, 25, 27, 28, 30, // 8
			
 
				-    32, 33, 35, 36, 38, 39, 41, 42, // 16
			
 
				-    43, 45, 46, 48, 49, 51, 52, 53, // 24
			
 
				-    55, 56, 58, 59, 60, 62, 63, 64, // 32
			
 
				-];
			
 
				-
			
 
				 // Arc<...> wrapper so that cache entries can be initialized without locking
			
 
				 // the entire cache.
			
 
				 type LruCacheOnce<K, V> = RwLock<LruCache<K, Arc<OnceLock<V>>>>;
			
@@ -165,324 +150,6 @@ impl Shredder {
 
				         .partition(Shred::is_data)
			
 
				     }
			
 
				 
			
 
				-    // For legacy tests and benchmarks.
			
 
				-    #[allow(clippy::too_many_arguments)]
			
 
				-    pub fn entries_to_shreds(
			
 
				-        &self,
			
 
				-        keypair: &Keypair,
			
 
				-        entries: &[Entry],
			
 
				-        is_last_in_slot: bool,
			
 
				-        chained_merkle_root: Option<Hash>,
			
 
				-        next_shred_index: u32,
			
 
				-        next_code_index: u32,
			
 
				-        merkle_variant: bool,
			
 
				-        reed_solomon_cache: &ReedSolomonCache,
			
 
				-        stats: &mut ProcessShredsStats,
			
 
				-    ) -> (
			
 
				-        Vec<Shred>, // data shreds
			
 
				-        Vec<Shred>, // coding shreds
			
 
				-    ) {
			
 
				-        if merkle_variant {
			
 
				-            return self
			
 
				-                .make_merkle_shreds_from_entries(
			
 
				-                    keypair,
			
 
				-                    entries,
			
 
				-                    is_last_in_slot,
			
 
				-                    chained_merkle_root,
			
 
				-                    next_shred_index,
			
 
				-                    next_code_index,
			
 
				-                    reed_solomon_cache,
			
 
				-                    stats,
			
 
				-                )
			
 
				-                .partition(Shred::is_data);
			
 
				-        }
			
 
				-        let data_shreds =
			
 
				-            self.entries_to_data_shreds(keypair, entries, is_last_in_slot, next_shred_index, stats);
			
 
				-        let coding_shreds = Self::data_shreds_to_coding_shreds(
			
 
				-            keypair,
			
 
				-            &data_shreds,
			
 
				-            next_code_index,
			
 
				-            reed_solomon_cache,
			
 
				-            stats,
			
 
				-        )
			
 
				-        .unwrap();
			
 
				-        (data_shreds, coding_shreds)
			
 
				-    }
			
 
				-
			
 
				-    fn entries_to_data_shreds(
			
 
				-        &self,
			
 
				-        keypair: &Keypair,
			
 
				-        entries: &[Entry],
			
 
				-        is_last_in_slot: bool,
			
 
				-        next_shred_index: u32,
			
 
				-        process_stats: &mut ProcessShredsStats,
			
 
				-    ) -> Vec<Shred> {
			
 
				-        let mut serialize_time = Measure::start("shred_serialize");
			
 
				-        let serialized_shreds =
			
 
				-            bincode::serialize(entries).expect("Expect to serialize all entries");
			
 
				-        serialize_time.stop();
			
 
				-
			
 
				-        let mut gen_data_time = Measure::start("shred_gen_data_time");
			
 
				-        let data_buffer_size = ShredData::capacity(/*merkle_proof_size:*/ None).unwrap();
			
 
				-        // Integer division to ensure we have enough shreds to fit all the data
			
 
				-        let num_shreds = serialized_shreds.len().div_ceil(data_buffer_size);
			
 
				-        let last_shred_index = next_shred_index + num_shreds as u32 - 1;
			
 
				-        // 1) Generate data shreds
			
 
				-        let make_data_shred = |data, shred_index: u32, fec_set_index: u32| {
			
 
				-            let flags = if shred_index != last_shred_index {
			
 
				-                ShredFlags::empty()
			
 
				-            } else if is_last_in_slot {
			
 
				-                // LAST_SHRED_IN_SLOT also implies DATA_COMPLETE_SHRED.
			
 
				-                ShredFlags::LAST_SHRED_IN_SLOT
			
 
				-            } else {
			
 
				-                ShredFlags::DATA_COMPLETE_SHRED
			
 
				-            };
			
 
				-            let parent_offset = self.slot - self.parent_slot;
			
 
				-            let mut shred = Shred::new_from_data(
			
 
				-                self.slot,
			
 
				-                shred_index,
			
 
				-                parent_offset as u16,
			
 
				-                data,
			
 
				-                flags,
			
 
				-                self.reference_tick,
			
 
				-                self.version,
			
 
				-                fec_set_index,
			
 
				-            );
			
 
				-            shred.sign(keypair);
			
 
				-            shred
			
 
				-        };
			
 
				-        let shreds: Vec<&[u8]> = serialized_shreds.chunks(data_buffer_size).collect();
			
 
				-        let fec_set_offsets: Vec<usize> =
			
 
				-            get_fec_set_offsets(shreds.len(), DATA_SHREDS_PER_FEC_BLOCK).collect();
			
 
				-        assert_eq!(shreds.len(), fec_set_offsets.len());
			
 
				-        let shreds: Vec<Shred> = PAR_THREAD_POOL.install(|| {
			
 
				-            shreds
			
 
				-                .into_par_iter()
			
 
				-                .zip(fec_set_offsets)
			
 
				-                .enumerate()
			
 
				-                .map(|(i, (shred, offset))| {
			
 
				-                    let shred_index = next_shred_index + i as u32;
			
 
				-                    let fec_set_index = next_shred_index + offset as u32;
			
 
				-                    make_data_shred(shred, shred_index, fec_set_index)
			
 
				-                })
			
 
				-                .collect()
			
 
				-        });
			
 
				-        gen_data_time.stop();
			
 
				-
			
 
				-        process_stats.serialize_elapsed += serialize_time.as_us();
			
 
				-        process_stats.gen_data_elapsed += gen_data_time.as_us();
			
 
				-        process_stats.record_num_data_shreds(shreds.len());
			
 
				-
			
 
				-        shreds
			
 
				-    }
			
 
				-
			
 
				-    fn data_shreds_to_coding_shreds(
			
 
				-        keypair: &Keypair,
			
 
				-        data_shreds: &[Shred],
			
 
				-        next_code_index: u32,
			
 
				-        reed_solomon_cache: &ReedSolomonCache,
			
 
				-        process_stats: &mut ProcessShredsStats,
			
 
				-    ) -> Result<Vec<Shred>, Error> {
			
 
				-        if data_shreds.is_empty() {
			
 
				-            return Ok(Vec::default());
			
 
				-        }
			
 
				-        let mut gen_coding_time = Measure::start("gen_coding_shreds");
			
 
				-        let chunks: Vec<Vec<&Shred>> = data_shreds
			
 
				-            .iter()
			
 
				-            .group_by(|shred| shred.fec_set_index())
			
 
				-            .into_iter()
			
 
				-            .map(|(_, shreds)| shreds.collect())
			
 
				-            .collect();
			
 
				-        let next_code_index: Vec<_> = std::iter::once(next_code_index)
			
 
				-            .chain(
			
 
				-                chunks
			
 
				-                    .iter()
			
 
				-                    .scan(next_code_index, |next_code_index, chunk| {
			
 
				-                        let num_data_shreds = chunk.len();
			
 
				-                        let is_last_in_slot = chunk
			
 
				-                            .last()
			
 
				-                            .copied()
			
 
				-                            .map(Shred::last_in_slot)
			
 
				-                            .unwrap_or(true);
			
 
				-                        let erasure_batch_size =
			
 
				-                            get_erasure_batch_size(num_data_shreds, is_last_in_slot);
			
 
				-                        *next_code_index += (erasure_batch_size - num_data_shreds) as u32;
			
 
				-                        Some(*next_code_index)
			
 
				-                    }),
			
 
				-            )
			
 
				-            .collect();
			
 
				-        // 1) Generate coding shreds
			
 
				-        let mut coding_shreds: Vec<_> = if chunks.len() <= 1 {
			
 
				-            chunks
			
 
				-                .into_iter()
			
 
				-                .zip(next_code_index)
			
 
				-                .flat_map(|(shreds, next_code_index)| {
			
 
				-                    #[allow(deprecated)]
			
 
				-                    Shredder::generate_coding_shreds(&shreds, next_code_index, reed_solomon_cache)
			
 
				-                })
			
 
				-                .collect()
			
 
				-        } else {
			
 
				-            PAR_THREAD_POOL.install(|| {
			
 
				-                chunks
			
 
				-                    .into_par_iter()
			
 
				-                    .zip(next_code_index)
			
 
				-                    .flat_map(|(shreds, next_code_index)| {
			
 
				-                        #[allow(deprecated)]
			
 
				-                        Shredder::generate_coding_shreds(
			
 
				-                            &shreds,
			
 
				-                            next_code_index,
			
 
				-                            reed_solomon_cache,
			
 
				-                        )
			
 
				-                    })
			
 
				-                    .collect()
			
 
				-            })
			
 
				-        };
			
 
				-        gen_coding_time.stop();
			
 
				-
			
 
				-        let mut sign_coding_time = Measure::start("sign_coding_shreds");
			
 
				-        // 2) Sign coding shreds
			
 
				-        PAR_THREAD_POOL.install(|| {
			
 
				-            coding_shreds.par_iter_mut().for_each(|coding_shred| {
			
 
				-                coding_shred.sign(keypair);
			
 
				-            })
			
 
				-        });
			
 
				-        sign_coding_time.stop();
			
 
				-
			
 
				-        process_stats.gen_coding_elapsed += gen_coding_time.as_us();
			
 
				-        process_stats.sign_coding_elapsed += sign_coding_time.as_us();
			
 
				-        Ok(coding_shreds)
			
 
				-    }
			
 
				-
			
 
				-    /// Generates coding shreds for the data shreds in the current FEC set
			
 
				-    #[deprecated(since = "2.3.0", note = "Legacy shreds are deprecated")]
			
 
				-    pub fn generate_coding_shreds<T: Borrow<Shred>>(
			
 
				-        data: &[T],
			
 
				-        next_code_index: u32,
			
 
				-        reed_solomon_cache: &ReedSolomonCache,
			
 
				-    ) -> Vec<Shred> {
			
 
				-        let (slot, index, version, fec_set_index) = {
			
 
				-            let shred = data.first().unwrap().borrow();
			
 
				-            (
			
 
				-                shred.slot(),
			
 
				-                shred.index(),
			
 
				-                shred.version(),
			
 
				-                shred.fec_set_index(),
			
 
				-            )
			
 
				-        };
			
 
				-        assert_eq!(fec_set_index, index);
			
 
				-        assert!(data
			
 
				-            .iter()
			
 
				-            .map(Borrow::borrow)
			
 
				-            .all(|shred| shred.slot() == slot
			
 
				-                && shred.version() == version
			
 
				-                && shred.fec_set_index() == fec_set_index));
			
 
				-        let num_data = data.len();
			
 
				-        let is_last_in_slot = data
			
 
				-            .last()
			
 
				-            .map(Borrow::borrow)
			
 
				-            .map(Shred::last_in_slot)
			
 
				-            .unwrap_or(true);
			
 
				-        let num_coding = get_erasure_batch_size(num_data, is_last_in_slot)
			
 
				-            .checked_sub(num_data)
			
 
				-            .unwrap();
			
 
				-        assert!(num_coding > 0);
			
 
				-        let data: Vec<_> = data
			
 
				-            .iter()
			
 
				-            .map(Borrow::borrow)
			
 
				-            .map(Shred::erasure_shard)
			
 
				-            .collect::<Result<_, _>>()
			
 
				-            .unwrap();
			
 
				-        let mut parity = vec![vec![0u8; data[0].len()]; num_coding];
			
 
				-        reed_solomon_cache
			
 
				-            .get(num_data, num_coding)
			
 
				-            .unwrap()
			
 
				-            .encode_sep(&data, &mut parity[..])
			
 
				-            .unwrap();
			
 
				-        let num_data = u16::try_from(num_data).unwrap();
			
 
				-        let num_coding = u16::try_from(num_coding).unwrap();
			
 
				-        parity
			
 
				-            .iter()
			
 
				-            .enumerate()
			
 
				-            .map(|(i, parity)| {
			
 
				-                let index = next_code_index + u32::try_from(i).unwrap();
			
 
				-                #[allow(deprecated)]
			
 
				-                Shred::new_from_parity_shard(
			
 
				-                    slot,
			
 
				-                    index,
			
 
				-                    parity,
			
 
				-                    fec_set_index,
			
 
				-                    num_data,
			
 
				-                    num_coding,
			
 
				-                    u16::try_from(i).unwrap(), // position
			
 
				-                    version,
			
 
				-                )
			
 
				-            })
			
 
				-            .collect()
			
 
				-    }
			
 
				-
			
 
				-    pub fn try_recovery(
			
 
				-        shreds: Vec<Shred>,
			
 
				-        reed_solomon_cache: &ReedSolomonCache,
			
 
				-    ) -> Result<Vec<Shred>, Error> {
			
 
				-        let (slot, fec_set_index) = match shreds.first() {
			
 
				-            None => return Err(Error::from(TooFewShardsPresent)),
			
 
				-            Some(shred) => (shred.slot(), shred.fec_set_index()),
			
 
				-        };
			
 
				-        let (num_data_shreds, num_coding_shreds) = match shreds.iter().find(|shred| shred.is_code())
			
 
				-        {
			
 
				-            None => return Ok(Vec::default()),
			
 
				-            Some(shred) => (
			
 
				-                shred.num_data_shreds().unwrap(),
			
 
				-                shred.num_coding_shreds().unwrap(),
			
 
				-            ),
			
 
				-        };
			
 
				-        debug_assert!(shreds
			
 
				-            .iter()
			
 
				-            .all(|shred| shred.slot() == slot && shred.fec_set_index() == fec_set_index));
			
 
				-        debug_assert!(shreds
			
 
				-            .iter()
			
 
				-            .filter(|shred| shred.is_code())
			
 
				-            .all(|shred| shred.num_data_shreds().unwrap() == num_data_shreds
			
 
				-                && shred.num_coding_shreds().unwrap() == num_coding_shreds));
			
 
				-        let num_data_shreds = num_data_shreds as usize;
			
 
				-        let num_coding_shreds = num_coding_shreds as usize;
			
 
				-        let fec_set_size = num_data_shreds + num_coding_shreds;
			
 
				-        if num_coding_shreds == 0 || shreds.len() >= fec_set_size {
			
 
				-            return Ok(Vec::default());
			
 
				-        }
			
 
				-        // Mask to exclude data shreds already received from the return value.
			
 
				-        let mut mask = vec![false; num_data_shreds];
			
 
				-        let mut shards = vec![None; fec_set_size];
			
 
				-        for shred in shreds {
			
 
				-            let index = match shred.erasure_shard_index() {
			
 
				-                Ok(index) if index < fec_set_size => index,
			
 
				-                _ => return Err(Error::from(InvalidIndex)),
			
 
				-            };
			
 
				-            shards[index] = Some(shred.erasure_shard()?.to_vec());
			
 
				-            if index < num_data_shreds {
			
 
				-                mask[index] = true;
			
 
				-            }
			
 
				-        }
			
 
				-        reed_solomon_cache
			
 
				-            .get(num_data_shreds, num_coding_shreds)?
			
 
				-            .reconstruct_data(&mut shards)?;
			
 
				-        let recovered_data = mask
			
 
				-            .into_iter()
			
 
				-            .zip(shards)
			
 
				-            .filter(|(mask, _)| !mask)
			
 
				-            .filter_map(|(_, shard)| Shred::new_from_serialized_shred(shard?).ok())
			
 
				-            .filter(|shred| {
			
 
				-                shred.slot() == slot
			
 
				-                    && shred.is_data()
			
 
				-                    && match shred.erasure_shard_index() {
			
 
				-                        Ok(index) => index < num_data_shreds,
			
 
				-                        Err(_) => false,
			
 
				-                    }
			
 
				-            })
			
 
				-            .collect();
			
 
				-        Ok(recovered_data)
			
 
				-    }
			
 
				-
			
 
				     /// Combines all shreds to recreate the original buffer
			
 
				     pub fn deshred<I, T: AsRef<[u8]>>(shreds: I) -> Result<Vec<u8>, Error>
			
 
				     where
			
@@ -562,61 +229,25 @@ impl Default for ReedSolomonCache {
 
				     }
			
 
				 }
			
 
				 
			
 
				-/// Maps number of data shreds in each batch to the erasure batch size.
			
 
				-pub(crate) fn get_erasure_batch_size(num_data_shreds: usize, is_last_in_slot: bool) -> usize {
			
 
				-    let erasure_batch_size = ERASURE_BATCH_SIZE
			
 
				-        .get(num_data_shreds)
			
 
				-        .copied()
			
 
				-        .unwrap_or(2 * num_data_shreds);
			
 
				-    if is_last_in_slot {
			
 
				-        erasure_batch_size.max(2 * DATA_SHREDS_PER_FEC_BLOCK)
			
 
				-    } else {
			
 
				-        erasure_batch_size
			
 
				-    }
			
 
				-}
			
 
				-
			
 
				-// Returns offsets to fec_set_index when spliting shreds into erasure batches.
			
 
				-fn get_fec_set_offsets(
			
 
				-    mut num_shreds: usize,
			
 
				-    min_chunk_size: usize,
			
 
				-) -> impl Iterator<Item = usize> {
			
 
				-    let mut offset = 0;
			
 
				-    std::iter::from_fn(move || {
			
 
				-        if num_shreds == 0 {
			
 
				-            return None;
			
 
				-        }
			
 
				-        let num_chunks = (num_shreds / min_chunk_size).max(1);
			
 
				-        let chunk_size = num_shreds.div_ceil(num_chunks);
			
 
				-        let offsets = std::iter::repeat_n(offset, chunk_size);
			
 
				-        num_shreds -= chunk_size;
			
 
				-        offset += chunk_size;
			
 
				-        Some(offsets)
			
 
				-    })
			
 
				-    .flatten()
			
 
				-}
			
 
				-
			
 
				 #[cfg(test)]
			
 
				 mod tests {
			
 
				     use {
			
 
				         super::*,
			
 
				-        crate::{
			
 
				-            blockstore::MAX_DATA_SHREDS_PER_SLOT,
			
 
				-            shred::{
			
 
				-                self, max_entries_per_n_shred, max_ticks_per_n_shreds, verify_test_data_shred,
			
 
				-                ShredType, CODING_SHREDS_PER_FEC_BLOCK, MAX_CODE_SHREDS_PER_SLOT,
			
 
				-            },
			
 
				+        crate::shred::{
			
 
				+            self, max_ticks_per_n_shreds, verify_test_data_shred, ShredType,
			
 
				+            CODING_SHREDS_PER_FEC_BLOCK,
			
 
				         },
			
 
				         assert_matches::assert_matches,
			
 
				-        rand::{seq::SliceRandom, Rng},
			
 
				+        itertools::Itertools,
			
 
				+        rand::Rng,
			
 
				         solana_hash::Hash,
			
 
				         solana_pubkey::Pubkey,
			
 
				         solana_sha256_hasher::hash,
			
 
				         solana_shred_version as shred_version,
			
 
				-        solana_signature::Signature,
			
 
				         solana_signer::Signer,
			
 
				         solana_system_transaction as system_transaction,
			
 
				-        std::{collections::HashSet, convert::TryInto, iter::repeat_with, sync::Arc},
			
 
				-        test_case::{test_case, test_matrix},
			
 
				+        std::{collections::HashSet, sync::Arc},
			
 
				+        test_case::test_matrix,
			
 
				     };
			
 
				 
			
 
				     fn verify_test_code_shred(shred: &Shred, index: u32, slot: Slot, pk: &Pubkey, verify: bool) {
			
@@ -909,320 +540,6 @@ mod tests {
 
				         run_test_data_and_code_shredder(0x1234_5678_9abc_def0, chained, is_last_in_slot);
			
 
				     }
			
 
				 
			
 
				-    fn run_test_recovery_and_reassembly(slot: Slot, is_last_in_slot: bool) {
			
 
				-        let keypair = Arc::new(Keypair::new());
			
 
				-        let shredder = Shredder::new(slot, slot - 5, 0, 0).unwrap();
			
 
				-        let keypair0 = Keypair::new();
			
 
				-        let keypair1 = Keypair::new();
			
 
				-        let tx0 = system_transaction::transfer(&keypair0, &keypair1.pubkey(), 1, Hash::default());
			
 
				-        let entry = Entry::new(&Hash::default(), 1, vec![tx0]);
			
 
				-
			
 
				-        let num_data_shreds: usize = 5;
			
 
				-        let data_buffer_size = ShredData::capacity(/*merkle_proof_size:*/ None).unwrap();
			
 
				-        let num_entries =
			
 
				-            max_entries_per_n_shred(&entry, num_data_shreds as u64, Some(data_buffer_size));
			
 
				-        let entries: Vec<_> = (0..num_entries)
			
 
				-            .map(|_| {
			
 
				-                let keypair0 = Keypair::new();
			
 
				-                let keypair1 = Keypair::new();
			
 
				-                let tx0 =
			
 
				-                    system_transaction::transfer(&keypair0, &keypair1.pubkey(), 1, Hash::default());
			
 
				-                Entry::new(&Hash::default(), 1, vec![tx0])
			
 
				-            })
			
 
				-            .collect();
			
 
				-
			
 
				-        let reed_solomon_cache = ReedSolomonCache::default();
			
 
				-        let serialized_entries = bincode::serialize(&entries).unwrap();
			
 
				-        let (data_shreds, coding_shreds) = shredder.entries_to_shreds(
			
 
				-            &keypair,
			
 
				-            &entries,
			
 
				-            is_last_in_slot,
			
 
				-            None,  // chained_merkle_root
			
 
				-            0,     // next_shred_index
			
 
				-            0,     // next_code_index
			
 
				-            false, // merkle_variant
			
 
				-            &reed_solomon_cache,
			
 
				-            &mut ProcessShredsStats::default(),
			
 
				-        );
			
 
				-        let num_coding_shreds = coding_shreds.len();
			
 
				-
			
 
				-        // We should have 5 data shreds now
			
 
				-        assert_eq!(data_shreds.len(), num_data_shreds);
			
 
				-        assert_eq!(
			
 
				-            num_coding_shreds,
			
 
				-            get_erasure_batch_size(num_data_shreds, is_last_in_slot) - num_data_shreds
			
 
				-        );
			
 
				-
			
 
				-        let all_shreds = data_shreds
			
 
				-            .iter()
			
 
				-            .cloned()
			
 
				-            .chain(coding_shreds.iter().cloned())
			
 
				-            .collect::<Vec<_>>();
			
 
				-
			
 
				-        // Test0: Try recovery/reassembly with only data shreds, but not all data shreds. Hint: should fail
			
 
				-        assert_eq!(
			
 
				-            Shredder::try_recovery(
			
 
				-                data_shreds[..data_shreds.len() - 1].to_vec(),
			
 
				-                &reed_solomon_cache
			
 
				-            )
			
 
				-            .unwrap(),
			
 
				-            Vec::default()
			
 
				-        );
			
 
				-
			
 
				-        // Test1: Try recovery/reassembly with only data shreds. Hint: should work
			
 
				-        let recovered_data =
			
 
				-            Shredder::try_recovery(data_shreds[..].to_vec(), &reed_solomon_cache).unwrap();
			
 
				-        assert!(recovered_data.is_empty());
			
 
				-
			
 
				-        // Test2: Try recovery/reassembly with missing data shreds + coding shreds. Hint: should work
			
 
				-        let mut shred_info: Vec<Shred> = all_shreds
			
 
				-            .iter()
			
 
				-            .enumerate()
			
 
				-            .filter_map(|(i, b)| if i % 2 == 0 { Some(b.clone()) } else { None })
			
 
				-            .collect();
			
 
				-
			
 
				-        let mut recovered_data =
			
 
				-            Shredder::try_recovery(shred_info.clone(), &reed_solomon_cache).unwrap();
			
 
				-
			
 
				-        assert_eq!(recovered_data.len(), 2); // Data shreds 1 and 3 were missing
			
 
				-        let recovered_shred = recovered_data.remove(0);
			
 
				-        verify_test_data_shred(
			
 
				-            &recovered_shred,
			
 
				-            1,
			
 
				-            slot,
			
 
				-            slot - 5,
			
 
				-            &keypair.pubkey(),
			
 
				-            true,
			
 
				-            false,
			
 
				-            false,
			
 
				-        );
			
 
				-        shred_info.insert(1, recovered_shred);
			
 
				-
			
 
				-        let recovered_shred = recovered_data.remove(0);
			
 
				-        verify_test_data_shred(
			
 
				-            &recovered_shred,
			
 
				-            3,
			
 
				-            slot,
			
 
				-            slot - 5,
			
 
				-            &keypair.pubkey(),
			
 
				-            true,
			
 
				-            false,
			
 
				-            false,
			
 
				-        );
			
 
				-        shred_info.insert(3, recovered_shred);
			
 
				-
			
 
				-        let result = {
			
 
				-            let shreds = shred_info[..num_data_shreds].iter().map(Shred::payload);
			
 
				-            Shredder::deshred(shreds).unwrap()
			
 
				-        };
			
 
				-        assert!(result.len() >= serialized_entries.len());
			
 
				-        assert_eq!(serialized_entries[..], result[..serialized_entries.len()]);
			
 
				-
			
 
				-        // Test3: Try recovery/reassembly with 3 missing data shreds + 2 coding shreds. Hint: should work
			
 
				-        let mut shred_info: Vec<Shred> = all_shreds
			
 
				-            .iter()
			
 
				-            .enumerate()
			
 
				-            .filter_map(|(i, b)| if i % 2 != 0 { Some(b.clone()) } else { None })
			
 
				-            .collect();
			
 
				-
			
 
				-        let recovered_data =
			
 
				-            Shredder::try_recovery(shred_info.clone(), &reed_solomon_cache).unwrap();
			
 
				-
			
 
				-        assert_eq!(recovered_data.len(), 3); // Data shreds 0, 2, 4 were missing
			
 
				-        for (i, recovered_shred) in recovered_data.into_iter().enumerate() {
			
 
				-            let index = i * 2;
			
 
				-            let is_last_data = recovered_shred.index() as usize == num_data_shreds - 1;
			
 
				-            verify_test_data_shred(
			
 
				-                &recovered_shred,
			
 
				-                index.try_into().unwrap(),
			
 
				-                slot,
			
 
				-                slot - 5,
			
 
				-                &keypair.pubkey(),
			
 
				-                true,
			
 
				-                is_last_data && is_last_in_slot,
			
 
				-                is_last_data,
			
 
				-            );
			
 
				-
			
 
				-            shred_info.insert(i * 2, recovered_shred);
			
 
				-        }
			
 
				-
			
 
				-        let result = {
			
 
				-            let shreds = shred_info[..num_data_shreds].iter().map(Shred::payload);
			
 
				-            Shredder::deshred(shreds).unwrap()
			
 
				-        };
			
 
				-        assert!(result.len() >= serialized_entries.len());
			
 
				-        assert_eq!(serialized_entries[..], result[..serialized_entries.len()]);
			
 
				-
			
 
				-        // Test4: Try reassembly with 2 missing data shreds, but keeping the last
			
 
				-        // data shred. Hint: should fail
			
 
				-        let shreds: Vec<Shred> = all_shreds[..num_data_shreds]
			
 
				-            .iter()
			
 
				-            .enumerate()
			
 
				-            .filter_map(|(i, s)| {
			
 
				-                if (i < 4 && i % 2 != 0) || i == num_data_shreds - 1 {
			
 
				-                    // Keep 1, 3, 4
			
 
				-                    Some(s.clone())
			
 
				-                } else {
			
 
				-                    None
			
 
				-                }
			
 
				-            })
			
 
				-            .collect();
			
 
				-
			
 
				-        assert_eq!(shreds.len(), 3);
			
 
				-        assert_matches!(
			
 
				-            Shredder::deshred(shreds.iter().map(Shred::payload)),
			
 
				-            Err(Error::ErasureError(TooFewDataShards))
			
 
				-        );
			
 
				-
			
 
				-        // Test5: Try recovery/reassembly with non zero index full slot with 3 missing data shreds
			
 
				-        // and 2 missing coding shreds. Hint: should work
			
 
				-        let serialized_entries = bincode::serialize(&entries).unwrap();
			
 
				-        let (data_shreds, coding_shreds) = shredder.entries_to_shreds(
			
 
				-            &keypair,
			
 
				-            &entries,
			
 
				-            is_last_in_slot,
			
 
				-            None,  // chained_merkle_root
			
 
				-            25,    // next_shred_index,
			
 
				-            25,    // next_code_index
			
 
				-            false, // merkle_variant
			
 
				-            &ReedSolomonCache::default(),
			
 
				-            &mut ProcessShredsStats::default(),
			
 
				-        );
			
 
				-        // We should have 10 shreds now
			
 
				-        assert_eq!(data_shreds.len(), num_data_shreds);
			
 
				-
			
 
				-        let all_shreds = data_shreds
			
 
				-            .iter()
			
 
				-            .cloned()
			
 
				-            .chain(coding_shreds.iter().cloned())
			
 
				-            .collect::<Vec<_>>();
			
 
				-
			
 
				-        let mut shred_info: Vec<Shred> = all_shreds
			
 
				-            .iter()
			
 
				-            .enumerate()
			
 
				-            .filter_map(|(i, b)| if i % 2 != 0 { Some(b.clone()) } else { None })
			
 
				-            .collect();
			
 
				-
			
 
				-        let recovered_data =
			
 
				-            Shredder::try_recovery(shred_info.clone(), &reed_solomon_cache).unwrap();
			
 
				-
			
 
				-        assert_eq!(recovered_data.len(), 3); // Data shreds 25, 27, 29 were missing
			
 
				-        for (i, recovered_shred) in recovered_data.into_iter().enumerate() {
			
 
				-            let index = 25 + (i * 2);
			
 
				-            verify_test_data_shred(
			
 
				-                &recovered_shred,
			
 
				-                index.try_into().unwrap(),
			
 
				-                slot,
			
 
				-                slot - 5,
			
 
				-                &keypair.pubkey(),
			
 
				-                true,
			
 
				-                index == 25 + num_data_shreds - 1 && is_last_in_slot,
			
 
				-                index == 25 + num_data_shreds - 1,
			
 
				-            );
			
 
				-
			
 
				-            shred_info.insert(i * 2, recovered_shred);
			
 
				-        }
			
 
				-
			
 
				-        let result = {
			
 
				-            let shreds = shred_info[..num_data_shreds].iter().map(Shred::payload);
			
 
				-            Shredder::deshred(shreds).unwrap()
			
 
				-        };
			
 
				-        assert!(result.len() >= serialized_entries.len());
			
 
				-        assert_eq!(serialized_entries[..], result[..serialized_entries.len()]);
			
 
				-
			
 
				-        // Test6: Try recovery/reassembly with incorrect slot. Hint: does not recover any shreds
			
 
				-        let recovered_data =
			
 
				-            Shredder::try_recovery(shred_info.clone(), &reed_solomon_cache).unwrap();
			
 
				-        assert!(recovered_data.is_empty());
			
 
				-    }
			
 
				-
			
 
				-    #[test]
			
 
				-    fn test_recovery_and_reassembly() {
			
 
				-        run_test_recovery_and_reassembly(0x1234_5678_9abc_def0, false);
			
 
				-        run_test_recovery_and_reassembly(0x1234_5678_9abc_def0, true);
			
 
				-    }
			
 
				-
			
 
				-    fn run_recovery_with_expanded_coding_shreds(num_tx: usize, is_last_in_slot: bool) {
			
 
				-        let mut rng = rand::thread_rng();
			
 
				-        let txs = repeat_with(|| {
			
 
				-            let from_pubkey = Pubkey::new_unique();
			
 
				-            let instruction = solana_system_interface::instruction::transfer(
			
 
				-                &from_pubkey,
			
 
				-                &Pubkey::new_unique(), // to
			
 
				-                rng.gen(),             // lamports
			
 
				-            );
			
 
				-            let message = solana_message::Message::new(&[instruction], Some(&from_pubkey));
			
 
				-            let mut tx = solana_transaction::Transaction::new_unsigned(message);
			
 
				-            // Also randomize the signatre bytes.
			
 
				-            let mut signature = [0u8; 64];
			
 
				-            rng.fill(&mut signature[..]);
			
 
				-            tx.signatures = vec![Signature::from(signature)];
			
 
				-            tx
			
 
				-        })
			
 
				-        .take(num_tx)
			
 
				-        .collect();
			
 
				-        let entry = Entry::new(
			
 
				-            &Hash::new_unique(),  // prev hash
			
 
				-            rng.gen_range(1..64), // num hashes
			
 
				-            txs,
			
 
				-        );
			
 
				-        let keypair = Arc::new(Keypair::new());
			
 
				-        let slot = 71489660;
			
 
				-        let shredder = Shredder::new(
			
 
				-            slot,
			
 
				-            slot - rng.gen_range(1..27), // parent slot
			
 
				-            0,                           // reference tick
			
 
				-            rng.gen(),                   // version
			
 
				-        )
			
 
				-        .unwrap();
			
 
				-        let next_shred_index = rng.gen_range(1..1024);
			
 
				-        let reed_solomon_cache = ReedSolomonCache::default();
			
 
				-        let (data_shreds, coding_shreds) = shredder.entries_to_shreds(
			
 
				-            &keypair,
			
 
				-            &[entry],
			
 
				-            is_last_in_slot,
			
 
				-            None, // chained_merkle_root
			
 
				-            next_shred_index,
			
 
				-            next_shred_index, // next_code_index
			
 
				-            false,            // merkle_variant
			
 
				-            &reed_solomon_cache,
			
 
				-            &mut ProcessShredsStats::default(),
			
 
				-        );
			
 
				-        let num_data_shreds = data_shreds.len();
			
 
				-        let mut shreds = coding_shreds;
			
 
				-        shreds.extend(data_shreds.iter().cloned());
			
 
				-        shreds.shuffle(&mut rng);
			
 
				-        shreds.truncate(num_data_shreds);
			
 
				-        shreds.sort_by_key(|shred| {
			
 
				-            if shred.is_data() {
			
 
				-                shred.index()
			
 
				-            } else {
			
 
				-                shred.index() + num_data_shreds as u32
			
 
				-            }
			
 
				-        });
			
 
				-        let exclude: HashSet<_> = shreds
			
 
				-            .iter()
			
 
				-            .filter(|shred| shred.is_data())
			
 
				-            .map(|shred| shred.index())
			
 
				-            .collect();
			
 
				-        let recovered_shreds = Shredder::try_recovery(shreds, &reed_solomon_cache).unwrap();
			
 
				-        assert_eq!(
			
 
				-            recovered_shreds,
			
 
				-            data_shreds
			
 
				-                .into_iter()
			
 
				-                .filter(|shred| !exclude.contains(&shred.index()))
			
 
				-                .collect::<Vec<_>>()
			
 
				-        );
			
 
				-    }
			
 
				-
			
 
				-    #[test]
			
 
				-    fn test_recovery_with_expanded_coding_shreds() {
			
 
				-        for num_tx in 0..50 {
			
 
				-            run_recovery_with_expanded_coding_shreds(num_tx, false);
			
 
				-            run_recovery_with_expanded_coding_shreds(num_tx, true);
			
 
				-        }
			
 
				-    }
			
 
				-
			
 
				     #[test_matrix(
			
 
				         [true, false],
			
 
				         [true, false]
			
@@ -1321,106 +638,4 @@ mod tests {
 
				             data_shreds.last().unwrap().fec_set_index()
			
 
				         );
			
 
				     }
			
 
				-
			
 
				-    #[test_case(false)]
			
 
				-    #[test_case(true)]
			
 
				-    fn test_max_coding_shreds(is_last_in_slot: bool) {
			
 
				-        let keypair = Arc::new(Keypair::new());
			
 
				-        let hash = hash(Hash::default().as_ref());
			
 
				-        let version = shred_version::version_from_hash(&hash);
			
 
				-        assert_ne!(version, 0);
			
 
				-        let shredder = Shredder::new(0, 0, 0, version).unwrap();
			
 
				-        let entries: Vec<_> = (0..500)
			
 
				-            .map(|_| {
			
 
				-                let keypair0 = Keypair::new();
			
 
				-                let keypair1 = Keypair::new();
			
 
				-                let tx0 =
			
 
				-                    system_transaction::transfer(&keypair0, &keypair1.pubkey(), 1, Hash::default());
			
 
				-                Entry::new(&Hash::default(), 1, vec![tx0])
			
 
				-            })
			
 
				-            .collect();
			
 
				-
			
 
				-        let mut stats = ProcessShredsStats::default();
			
 
				-        let start_index = 0x12;
			
 
				-        let data_shreds = shredder.entries_to_data_shreds(
			
 
				-            &keypair,
			
 
				-            &entries,
			
 
				-            is_last_in_slot,
			
 
				-            start_index,
			
 
				-            &mut stats,
			
 
				-        );
			
 
				-
			
 
				-        let next_code_index = data_shreds[0].index();
			
 
				-        let reed_solomon_cache = ReedSolomonCache::default();
			
 
				-
			
 
				-        for size in (1..data_shreds.len()).step_by(5) {
			
 
				-            let data_shreds = &data_shreds[..size];
			
 
				-            let coding_shreds = Shredder::data_shreds_to_coding_shreds(
			
 
				-                &keypair,
			
 
				-                data_shreds,
			
 
				-                next_code_index,
			
 
				-                &reed_solomon_cache,
			
 
				-                &mut stats,
			
 
				-            )
			
 
				-            .unwrap();
			
 
				-            let num_shreds: usize = data_shreds
			
 
				-                .iter()
			
 
				-                .group_by(|shred| shred.fec_set_index())
			
 
				-                .into_iter()
			
 
				-                .map(|(_, chunk)| {
			
 
				-                    let chunk: Vec<_> = chunk.collect();
			
 
				-                    get_erasure_batch_size(chunk.len(), chunk.last().unwrap().last_in_slot())
			
 
				-                })
			
 
				-                .sum();
			
 
				-            assert_eq!(coding_shreds.len(), num_shreds - data_shreds.len());
			
 
				-        }
			
 
				-    }
			
 
				-
			
 
				-    #[test]
			
 
				-    fn test_get_fec_set_offsets() {
			
 
				-        const MIN_CHUNK_SIZE: usize = 32usize;
			
 
				-        for num_shreds in 0usize..MIN_CHUNK_SIZE {
			
 
				-            let offsets: Vec<_> = get_fec_set_offsets(num_shreds, MIN_CHUNK_SIZE).collect();
			
 
				-            assert_eq!(offsets, vec![0usize; num_shreds]);
			
 
				-        }
			
 
				-        for num_shreds in MIN_CHUNK_SIZE..MIN_CHUNK_SIZE * 8 {
			
 
				-            let chunks: Vec<_> = get_fec_set_offsets(num_shreds, MIN_CHUNK_SIZE)
			
 
				-                .group_by(|offset| *offset)
			
 
				-                .into_iter()
			
 
				-                .map(|(offset, chunk)| (offset, chunk.count()))
			
 
				-                .collect();
			
 
				-            assert_eq!(
			
 
				-                chunks
			
 
				-                    .iter()
			
 
				-                    .map(|(_offset, chunk_size)| chunk_size)
			
 
				-                    .sum::<usize>(),
			
 
				-                num_shreds
			
 
				-            );
			
 
				-            assert!(chunks
			
 
				-                .iter()
			
 
				-                .all(|(_offset, chunk_size)| *chunk_size >= MIN_CHUNK_SIZE));
			
 
				-            assert!(chunks
			
 
				-                .iter()
			
 
				-                .all(|(_offset, chunk_size)| *chunk_size < 2 * MIN_CHUNK_SIZE));
			
 
				-            assert_eq!(chunks[0].0, 0);
			
 
				-            assert!(chunks.iter().tuple_windows().all(
			
 
				-                |((offset, chunk_size), (next_offset, _chunk_size))| offset + chunk_size
			
 
				-                    == *next_offset
			
 
				-            ));
			
 
				-        }
			
 
				-    }
			
 
				-
			
 
				-    #[test]
			
 
				-    fn test_max_shreds_per_slot() {
			
 
				-        for num_data_shreds in 32..128 {
			
 
				-            let num_coding_shreds =
			
 
				-                get_erasure_batch_size(num_data_shreds, /*is_last_in_slot:*/ false)
			
 
				-                    .checked_sub(num_data_shreds)
			
 
				-                    .unwrap();
			
 
				-            assert!(
			
 
				-                MAX_DATA_SHREDS_PER_SLOT * num_coding_shreds
			
 
				-                    <= MAX_CODE_SHREDS_PER_SLOT * num_data_shreds
			
 
				-            );
			
 
				-        }
			
 
				-    }
			
 
				 }
			
--- a/ledger/tests/shred.rs
+++ b/ledger/tests/shred.rs
@@ -5,7 +5,7 @@ use {
 
				     solana_hash::Hash,
			
 
				     solana_keypair::Keypair,
			
 
				     solana_ledger::shred::{
			
 
				-        max_entries_per_n_shred, recover, verify_test_data_shred, ProcessShredsStats,
			
 
				+        self, max_entries_per_n_shred, recover, verify_test_data_shred, ProcessShredsStats,
			
 
				         ReedSolomonCache, Shred, ShredData, Shredder, DATA_SHREDS_PER_FEC_BLOCK,
			
 
				     },
			
 
				     solana_signer::Signer,
			
@@ -135,7 +135,13 @@ fn test_multi_fec_block_different_size_coding() {
 
				             .chain(fec_coding_shreds.iter().step_by(2))
			
 
				             .cloned()
			
 
				             .collect();
			
 
				-        let recovered_data = Shredder::try_recovery(all_shreds, &reed_solomon_cache).unwrap();
			
 
				+        let recovered_data: Vec<Shred> = shred::recover(all_shreds, &reed_solomon_cache)
			
 
				+            .unwrap()
			
 
				+            .filter_map(|s| {
			
 
				+                let s = s.unwrap();
			
 
				+                s.is_data().then_some(s)
			
 
				+            })
			
 
				+            .collect();
			
 
				         // Necessary in order to ensure the last shred in the slot
			
 
				         // is part of the recovered set, and that the below `index`
			
 
				         // calculation in the loop is correct