cmd_out_amaxoncart.txt

PS D:\Ribhav\Code\HackAIML> py main.py
Classify the Input into these categories: False Urgency,Basket Sneaking,Confirm Shaming,Forced Action,Subscription Trap,Interface interference,Bait and switch,Drip pricing,Disguised advertisement,Nagging; by returning
only 10 probability scores respectively; no text
loading model
llama_model_loader: loaded meta data with 19 key-value pairs and 363 tensors from ./models/vicuna-13b-v1.5.Q6_K.gguf (version GGUF V2)
llama_model_loader: Dumping metadata keys/values. Note: KV overrides do not apply in this output.
llama_model_loader: - kv   0:                       general.architecture str              = llama
llama_model_loader: - kv   1:                               general.name str              = LLaMA v2
llama_model_loader: - kv   2:                       llama.context_length u32              = 4096
llama_model_loader: - kv   3:                     llama.embedding_length u32              = 5120
llama_model_loader: - kv   4:                          llama.block_count u32              = 40
llama_model_loader: - kv   5:                  llama.feed_forward_length u32              = 13824
llama_model_loader: - kv   6:                 llama.rope.dimension_count u32              = 128
llama_model_loader: - kv   7:                 llama.attention.head_count u32              = 40
llama_model_loader: - kv   8:              llama.attention.head_count_kv u32              = 40
llama_model_loader: - kv   9:     llama.attention.layer_norm_rms_epsilon f32              = 0.000010
llama_model_loader: - kv  10:                          general.file_type u32              = 18
llama_model_loader: - kv  11:                       tokenizer.ggml.model str              = llama
llama_model_loader: - kv  12:                      tokenizer.ggml.tokens arr[str,32000]   = ["<unk>", "<s>", "</s>", "<0x00>", "<...
llama_model_loader: - kv  13:                      tokenizer.ggml.scores arr[f32,32000]   = [0.000000, 0.000000, 0.000000, 0.0000...
llama_model_loader: - kv  14:                  tokenizer.ggml.token_type arr[i32,32000]   = [2, 3, 3, 6, 6, 6, 6, 6, 6, 6, 6, 6, ...
llama_model_loader: - kv  15:                tokenizer.ggml.bos_token_id u32              = 1
llama_model_loader: - kv  16:                tokenizer.ggml.eos_token_id u32              = 2
llama_model_loader: - kv  17:            tokenizer.ggml.unknown_token_id u32              = 0
llama_model_loader: - kv  18:               general.quantization_version u32              = 2
llama_model_loader: - type  f32:   81 tensors
llama_model_loader: - type q6_K:  282 tensors
llm_load_vocab: special tokens definition check successful ( 259/32000 ).
llm_load_print_meta: format           = GGUF V2
llm_load_print_meta: arch             = llama
llm_load_print_meta: vocab type       = SPM
llm_load_print_meta: n_vocab          = 32000
llm_load_print_meta: n_merges         = 0
llm_load_print_meta: n_ctx_train      = 4096
llm_load_print_meta: n_embd           = 5120
llm_load_print_meta: n_head           = 40
llm_load_print_meta: n_head_kv        = 40
llm_load_print_meta: n_layer          = 40
llm_load_print_meta: n_rot            = 128
llm_load_print_meta: n_embd_head_k    = 128
llm_load_print_meta: n_embd_head_v    = 128
llm_load_print_meta: n_gqa            = 1
llm_load_print_meta: n_embd_k_gqa     = 5120
llm_load_print_meta: n_embd_v_gqa     = 5120
llm_load_print_meta: f_norm_eps       = 0.0e+00
llm_load_print_meta: f_norm_rms_eps   = 1.0e-05
llm_load_print_meta: f_clamp_kqv      = 0.0e+00
llm_load_print_meta: f_max_alibi_bias = 0.0e+00
llm_load_print_meta: n_ff             = 13824
llm_load_print_meta: n_expert         = 0
llm_load_print_meta: n_expert_used    = 0
llm_load_print_meta: rope scaling     = linear
llm_load_print_meta: freq_base_train  = 10000.0
llm_load_print_meta: freq_scale_train = 1
llm_load_print_meta: n_yarn_orig_ctx  = 4096
llm_load_print_meta: rope_finetuned   = unknown
llm_load_print_meta: model type       = 13B
llm_load_print_meta: model ftype      = Q6_K
llm_load_print_meta: model params     = 13.02 B
llm_load_print_meta: model size       = 9.95 GiB (6.56 BPW)
llm_load_print_meta: general.name     = LLaMA v2
llm_load_print_meta: BOS token        = 1 '<s>'
llm_load_print_meta: EOS token        = 2 '</s>'
llm_load_print_meta: UNK token        = 0 '<unk>'
llm_load_print_meta: LF token         = 13 '<0x0A>'
llm_load_tensors: ggml ctx size =    0.14 MiB
llm_load_tensors: offloading 0 repeating layers to GPU
llm_load_tensors: offloaded 0/41 layers to GPU
llm_load_tensors:        CPU buffer size = 10183.71 MiB
...................................................................................................
llama_new_context_with_model: n_ctx      = 512
llama_new_context_with_model: freq_base  = 10000.0
llama_new_context_with_model: freq_scale = 1
llama_kv_cache_init:        CPU KV buffer size =   400.00 MiB
llama_new_context_with_model: KV self size  =  400.00 MiB, K (f16):  200.00 MiB, V (f16):  200.00 MiB
llama_new_context_with_model:        CPU input buffer size   =    11.01 MiB
llama_new_context_with_model:        CPU compute buffer size =    81.40 MiB
llama_new_context_with_model: graph splits (measure): 1
AVX = 1 | AVX_VNNI = 0 | AVX2 = 1 | AVX512 = 1 | AVX512_VBMI = 0 | AVX512_VNNI = 0 | FMA = 1 | NEON = 0 | ARM_FMA = 0 | F16C = 1 | FP16_VA = 0 | WASM_SIMD = 0 | BLAS = 0 | SSE3 = 1 | SSSE3 = 0 | VSX = 0 |
Model metadata: {'general.name': 'LLaMA v2', 'general.architecture': 'llama', 'llama.context_length': '4096', 'llama.rope.dimension_count': '128', 'llama.embedding_length': '5120', 'llama.block_count': '40', 'llama.feed_forward_length': '13824', 'llama.attention.head_count': '40', 'tokenizer.ggml.eos_token_id': '2', 'general.file_type': '18', 'llama.attention.head_count_kv': '40', 'llama.attention.layer_norm_rms_epsilon': '0.000010', 'tokenizer.ggml.model': 'llama', 'general.quantization_version': '2', 'tokenizer.ggml.bos_token_id': '1', 'tokenizer.ggml.unknown_token_id': '0'}
loaded
running model

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.26 ms /   100 runs   (    0.22 ms per token,  4491.76 tokens per second)
llama_print_timings: prompt eval time =    8251.89 ms /    91 tokens (   90.68 ms per token,    11.03 tokens per second)
llama_print_timings:        eval time =   17873.02 ms /    99 runs   (  180.54 ms per token,     5.54 tokens per second)
llama_print_timings:       total time =   26416.31 ms /   190 tokens
Amazon.in Shopping Cart

0.2 0.1 0.1 0.3 0.2 0.1 0.1 0.1 0.2 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.26 ms /   100 runs   (    0.22 ms per token,  4492.56 tokens per second)
llama_print_timings: prompt eval time =     907.33 ms /    11 tokens (   82.48 ms per token,    12.12 tokens per second)
llama_print_timings:        eval time =   17588.25 ms /    99 runs   (  177.66 ms per token,     5.63 tokens per second)
llama_print_timings:       total time =   18787.07 ms /   110 tokens
Skip to main content

0.3 0.2 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.47 ms /   100 runs   (    0.22 ms per token,  4449.78 tokens per second)
llama_print_timings: prompt eval time =    1897.78 ms /    22 tokens (   86.26 ms per token,    11.59 tokens per second)
llama_print_timings:        eval time =   17459.20 ms /    99 runs   (  176.36 ms per token,     5.67 tokens per second)
llama_print_timings:       total time =   19653.07 ms /   121 tokens
Delivering to Chandigarh 160022

0.5368471397448979 0.34281226420360446 0.25123963712033172 0.21716205730207816 0.1883538487772
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.28 ms /   100 runs   (    0.22 ms per token,  4489.14 tokens per second)
llama_print_timings: prompt eval time =     838.21 ms /    10 tokens (   83.82 ms per token,    11.93 tokens per second)
llama_print_timings:        eval time =   17373.71 ms /    99 runs   (  175.49 ms per token,     5.70 tokens per second)
llama_print_timings:       total time =   18507.81 ms /   109 tokens
Search with any image

0.2 0.3 0.1 0.2 0.1 0.1 0.2 0.1 0.2 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.33 ms /   100 runs   (    0.22 ms per token,  4477.68 tokens per second)
llama_print_timings: prompt eval time =    1410.71 ms /    14 tokens (  100.77 ms per token,     9.92 tokens per second)
llama_print_timings:        eval time =   17880.50 ms /    99 runs   (  180.61 ms per token,     5.54 tokens per second)
llama_print_timings:       total time =   19588.66 ms /   113 tokens
Unsupported image file format.

0.1 0.05 0.05 0.15 0.05 0.1 0.05 0.0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.82 ms /   100 runs   (    0.23 ms per token,  4382.70 tokens per second)
llama_print_timings: prompt eval time =    2924.21 ms /    36 tokens (   81.23 ms per token,    12.31 tokens per second)
llama_print_timings:        eval time =   17334.00 ms /    99 runs   (  175.09 ms per token,     5.71 tokens per second)
llama_print_timings:       total time =   20561.77 ms /   135 tokens
Upload a JPEG, PNG, WEBP, GIF, SVG, AVIF, BMP or ICO image file.

1. 0.25 2. 0.2 3. 0.1 4. 0.3 5. 0.1 6. 0.1 7. 0.1 8. 0.1 9.
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.27 ms /   100 runs   (    0.22 ms per token,  4489.54 tokens per second)
llama_print_timings: prompt eval time =    1066.20 ms /    13 tokens (   82.02 ms per token,    12.19 tokens per second)
llama_print_timings:        eval time =   17420.86 ms /    99 runs   (  175.97 ms per token,     5.68 tokens per second)
llama_print_timings:       total time =   18784.28 ms /   112 tokens
Image file size is too large.

0.1 0.05 0.02 0.03 0.05 0.07 0.02 0.05 0.08 0.05
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.31 ms /   100 runs   (    0.22 ms per token,  4482.70 tokens per second)
llama_print_timings: prompt eval time =    1474.62 ms /    18 tokens (   81.92 ms per token,    12.21 tokens per second)
llama_print_timings:        eval time =   17636.65 ms /    99 runs   (  178.15 ms per token,     5.61 tokens per second)
llama_print_timings:       total time =   19408.86 ms /   117 tokens
Upload an image file size of 5 MB or less.

0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.27 ms /   100 runs   (    0.22 ms per token,  4489.94 tokens per second)
llama_print_timings: prompt eval time =    1237.75 ms /    10 tokens (  123.78 ms per token,     8.08 tokens per second)
llama_print_timings:        eval time =   17680.68 ms /    99 runs   (  178.59 ms per token,     5.60 tokens per second)
llama_print_timings:       total time =   19215.48 ms /   109 tokens
Drag an image here

0.3 0.2 0.15 0.15 0.15 0.15 0.15 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.33 ms /   100 runs   (    0.22 ms per token,  4478.28 tokens per second)
llama_print_timings: prompt eval time =     760.43 ms /     9 tokens (   84.49 ms per token,    11.84 tokens per second)
llama_print_timings:        eval time =   17502.59 ms /    99 runs   (  176.79 ms per token,     5.66 tokens per second)
llama_print_timings:       total time =   18560.35 ms /   108 tokens
Upload an image

0.02 0.10 0.05 0.15 0.10 0.0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.46 ms /   100 runs   (    0.22 ms per token,  4453.35 tokens per second)
llama_print_timings: prompt eval time =    1174.07 ms /    14 tokens (   83.86 ms per token,    11.92 tokens per second)
llama_print_timings:        eval time =   17685.77 ms /    99 runs   (  178.64 ms per token,     5.60 tokens per second)
llama_print_timings:       total time =   19160.13 ms /   113 tokens
Select the department you want to search in

0.25 0.15 0.1 0.2 0.05 0.15 0.05 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.24 ms /   100 runs   (    0.22 ms per token,  4496.00 tokens per second)
llama_print_timings: prompt eval time =     816.64 ms /    10 tokens (   81.66 ms per token,    12.25 tokens per second)
llama_print_timings:        eval time =   17412.10 ms /    99 runs   (  175.88 ms per token,     5.69 tokens per second)
llama_print_timings:       total time =   18526.72 ms /   109 tokens
Apps & Games

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.79 ms /   100 runs   (    0.23 ms per token,  4388.85 tokens per second)
llama_print_timings: prompt eval time =     922.03 ms /    11 tokens (   83.82 ms per token,    11.93 tokens per second)
llama_print_timings:        eval time =   17541.07 ms /    99 runs   (  177.18 ms per token,     5.64 tokens per second)
llama_print_timings:       total time =   18767.22 ms /   110 tokens
Car & Motorbike

0.2 0.1 0.1 0.1 0.1 0.1 0.2 0.2 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.28 ms /   100 runs   (    0.22 ms per token,  4489.34 tokens per second)
llama_print_timings: prompt eval time =     887.22 ms /    11 tokens (   80.66 ms per token,    12.40 tokens per second)
llama_print_timings:        eval time =   17786.55 ms /    99 runs   (  179.66 ms per token,     5.57 tokens per second)
llama_print_timings:       total time =   18971.63 ms /   110 tokens
Clothing & Accessories

0.2 0.3 0.1 0.4 0.1 0.1 0.2 0.2 0.1 0.2
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.26 ms /   100 runs   (    0.22 ms per token,  4492.97 tokens per second)
llama_print_timings: prompt eval time =    1003.13 ms /    11 tokens (   91.19 ms per token,    10.97 tokens per second)
llama_print_timings:        eval time =   17542.46 ms /    99 runs   (  177.20 ms per token,     5.64 tokens per second)
llama_print_timings:       total time =   18845.27 ms /   110 tokens
Computers & Accessories

0.65 0.25 0.05 0.1 0.02 0.08 0.1 0.15 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      18.40 ms /    82 runs   (    0.22 ms per token,  4455.55 tokens per second)
llama_print_timings: prompt eval time =     980.97 ms /    12 tokens (   81.75 ms per token,    12.23 tokens per second)
llama_print_timings:        eval time =   14400.16 ms /    81 runs   (  177.78 ms per token,     5.62 tokens per second)
llama_print_timings:       total time =   15623.83 ms /    93 tokens
Garden & Outdoors

0.2065 0.1305 0.0785 0.0705 0.0665 0.0605 0.0565 0.0495 0.0435 0.0395
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.26 ms /   100 runs   (    0.22 ms per token,  4492.97 tokens per second)
llama_print_timings: prompt eval time =    1116.51 ms /    14 tokens (   79.75 ms per token,    12.54 tokens per second)
llama_print_timings:        eval time =   17918.54 ms /    99 runs   (  181.00 ms per token,     5.53 tokens per second)
llama_print_timings:       total time =   19333.20 ms /   113 tokens
Grocery & Gourmet Foods

0.2 0.1 0.1 0.1 0.3 0.1 0.1 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.30 ms /   100 runs   (    0.22 ms per token,  4485.11 tokens per second)
llama_print_timings: prompt eval time =     895.12 ms /    11 tokens (   81.37 ms per token,    12.29 tokens per second)
llama_print_timings:        eval time =   17905.29 ms /    99 runs   (  180.86 ms per token,     5.53 tokens per second)
llama_print_timings:       total time =   19099.22 ms /   110 tokens
Health & Personal Care

0.5 0.3 0.3 0.6 0.3 0.2 0.2 0.4 0.4 0.2
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      23.16 ms /   100 runs   (    0.23 ms per token,  4317.04 tokens per second)
llama_print_timings: prompt eval time =     832.65 ms /    10 tokens (   83.26 ms per token,    12.01 tokens per second)
llama_print_timings:        eval time =   17530.72 ms /    99 runs   (  177.08 ms per token,     5.65 tokens per second)
llama_print_timings:       total time =   18672.59 ms /   109 tokens
Home & Kitchen

0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.36 ms /   100 runs   (    0.22 ms per token,  4472.67 tokens per second)
llama_print_timings: prompt eval time =     971.96 ms /    12 tokens (   81.00 ms per token,    12.35 tokens per second)
llama_print_timings:        eval time =   17388.69 ms /    99 runs   (  175.64 ms per token,     5.69 tokens per second)
llama_print_timings:       total time =   18660.23 ms /   111 tokens
Industrial & Scientific

0.32498242941730243 0.28718111217753447 0.18834492430766564 0.15150
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.84 ms /   100 runs   (    0.23 ms per token,  4378.86 tokens per second)
llama_print_timings: prompt eval time =    1594.22 ms /    12 tokens (  132.85 ms per token,     7.53 tokens per second)
llama_print_timings:        eval time =   17520.32 ms /    99 runs   (  176.97 ms per token,     5.65 tokens per second)
llama_print_timings:       total time =   19417.84 ms /   111 tokens
Luggage & Bags

0.5 0.3 0.2 0.1 0.2 0.1 0.2 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.75 ms /   100 runs   (    0.23 ms per token,  4395.22 tokens per second)
llama_print_timings: prompt eval time =    1032.00 ms /    13 tokens (   79.38 ms per token,    12.60 tokens per second)
llama_print_timings:        eval time =   17476.06 ms /    99 runs   (  176.53 ms per token,     5.66 tokens per second)
llama_print_timings:       total time =   18812.36 ms /   112 tokens
Movies & TV Shows

0.1 0.2 0.1 0.2 0.2 0.1 0.1 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.27 ms /   100 runs   (    0.22 ms per token,  4490.95 tokens per second)
llama_print_timings: prompt eval time =    1056.95 ms /    13 tokens (   81.30 ms per token,    12.30 tokens per second)
llama_print_timings:        eval time =   17456.94 ms /    99 runs   (  176.33 ms per token,     5.67 tokens per second)
llama_print_timings:       total time =   18814.08 ms /   112 tokens
Shoes & Handbags

0.2 0.3 0.1 0.4 0.1 0.15 0.25 0.3 0.15 0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.31 ms /   100 runs   (    0.22 ms per token,  4481.69 tokens per second)
llama_print_timings: prompt eval time =    1204.59 ms /    15 tokens (   80.31 ms per token,    12.45 tokens per second)
llama_print_timings:        eval time =   17622.59 ms /    99 runs   (  178.01 ms per token,     5.62 tokens per second)
llama_print_timings:       total time =   19126.91 ms /   114 tokens
Sports, Fitness & Outdoors

0.1 0.2 0.3 0.4 0.1 0.1 0.1 0.1 0.2 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.29 ms /   100 runs   (    0.22 ms per token,  4485.91 tokens per second)
llama_print_timings: prompt eval time =     974.59 ms /    10 tokens (   97.46 ms per token,    10.26 tokens per second)
llama_print_timings:        eval time =   17449.47 ms /    99 runs   (  176.26 ms per token,     5.67 tokens per second)
llama_print_timings:       total time =   18724.05 ms /   109 tokens
Subscribe & Save

0.5 0.3 0.2 0.3 0.4 0.3 0.2 0.2
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.31 ms /   100 runs   (    0.22 ms per token,  4481.49 tokens per second)
llama_print_timings: prompt eval time =     966.41 ms /    12 tokens (   80.53 ms per token,    12.42 tokens per second)
llama_print_timings:        eval time =   17421.15 ms /    99 runs   (  175.97 ms per token,     5.68 tokens per second)
llama_print_timings:       total time =   18687.92 ms /   111 tokens
Tools & Home Improvement

0.25 0.35 0.10 0.15 0.10 0.15 0.20 0.20 0.15
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.29 ms /   100 runs   (    0.22 ms per token,  4487.32 tokens per second)
llama_print_timings: prompt eval time =     822.81 ms /    10 tokens (   82.28 ms per token,    12.15 tokens per second)
llama_print_timings:        eval time =   17750.91 ms /    99 runs   (  179.30 ms per token,     5.58 tokens per second)
llama_print_timings:       total time =   18873.63 ms /   109 tokens
Toys & Games

0.05 0.03 0.06 0.08 0.02 0.04 0.05 0.07 0.03
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      12.26 ms /    55 runs   (    0.22 ms per token,  4486.87 tokens per second)
llama_print_timings: prompt eval time =     879.12 ms /    10 tokens (   87.91 ms per token,    11.37 tokens per second)
llama_print_timings:        eval time =    9502.98 ms /    54 runs   (  175.98 ms per token,     5.68 tokens per second)
llama_print_timings:       total time =   10543.90 ms /    64 tokens
Hello, sign in

0.1 0.2 0.3 0.15 0.25 0.1 0.2 0.15 0.2 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.52 ms /   100 runs   (    0.23 ms per token,  4440.69 tokens per second)
llama_print_timings: prompt eval time =     914.64 ms /    10 tokens (   91.46 ms per token,    10.93 tokens per second)
llama_print_timings:        eval time =   17553.73 ms /    99 runs   (  177.31 ms per token,     5.64 tokens per second)
llama_print_timings:       total time =   18771.04 ms /   109 tokens
Account & Lists

0.005 0.001 0.002 0.01 0.006 0.008 0.003 0.015
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.25 ms /   100 runs   (    0.22 ms per token,  4495.39 tokens per second)
llama_print_timings: prompt eval time =    1010.61 ms /    10 tokens (  101.06 ms per token,     9.90 tokens per second)
llama_print_timings:        eval time =   17596.94 ms /    99 runs   (  177.75 ms per token,     5.63 tokens per second)
llama_print_timings:       total time =   18908.59 ms /   109 tokens
Home & Kitchen

0.25 0.15 0.05 0.1 0.05 0.05 0.05 0.05 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.28 ms /   100 runs   (    0.22 ms per token,  4487.73 tokens per second)
llama_print_timings: prompt eval time =     936.48 ms /    11 tokens (   85.13 ms per token,    11.75 tokens per second)
llama_print_timings:        eval time =   17710.74 ms /    99 runs   (  178.90 ms per token,     5.59 tokens per second)
llama_print_timings:       total time =   18947.35 ms /   110 tokens
Car & Motorbike

0.2 0.3 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      23.17 ms /   100 runs   (    0.23 ms per token,  4315.37 tokens per second)
llama_print_timings: prompt eval time =    1228.23 ms /    10 tokens (  122.82 ms per token,     8.14 tokens per second)
llama_print_timings:        eval time =   17596.09 ms /    99 runs   (  177.74 ms per token,     5.63 tokens per second)
llama_print_timings:       total time =   19132.90 ms /   109 tokens
Toys & Games

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.27 ms /   100 runs   (    0.22 ms per token,  4490.75 tokens per second)
llama_print_timings: prompt eval time =    1694.54 ms /    12 tokens (  141.21 ms per token,     7.08 tokens per second)
llama_print_timings:        eval time =   17412.14 ms /    99 runs   (  175.88 ms per token,     5.69 tokens per second)
llama_print_timings:       total time =   19407.25 ms /   111 tokens
Beauty & Personal Care

0.2 0.3 0.1 0.15 0.1 0.1 0.15 0.1 0.15
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.24 ms /   100 runs   (    0.22 ms per token,  4496.61 tokens per second)
llama_print_timings: prompt eval time =    1341.51 ms /    16 tokens (   83.84 ms per token,    11.93 tokens per second)
llama_print_timings:        eval time =   17804.79 ms /    99 runs   (  179.85 ms per token,     5.56 tokens per second)
llama_print_timings:       total time =   19446.56 ms /   115 tokens
Sports, Fitness & Outdoors

0.1 0.2 0.1 0.2 0.2 0.1 0.1 0.2 0.2 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.75 ms /   100 runs   (    0.23 ms per token,  4395.60 tokens per second)
llama_print_timings: prompt eval time =    1183.56 ms /    14 tokens (   84.54 ms per token,    11.83 tokens per second)
llama_print_timings:        eval time =   17393.31 ms /    99 runs   (  175.69 ms per token,     5.69 tokens per second)
llama_print_timings:       total time =   18883.86 ms /   113 tokens
Health, Household & Personal Care

0.3 0.1 0.2 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.84 ms /   100 runs   (    0.23 ms per token,  4377.90 tokens per second)
llama_print_timings: prompt eval time =    1210.93 ms /    15 tokens (   80.73 ms per token,    12.39 tokens per second)
llama_print_timings:        eval time =   17448.07 ms /    99 runs   (  176.24 ms per token,     5.67 tokens per second)
llama_print_timings:       total time =   18966.78 ms /   114 tokens
Grocery & Gourmet Foods

0.05 0.05 0.05 0.05 0.05 0.05 0.05 0.05 0.05
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.81 ms /   100 runs   (    0.23 ms per token,  4383.85 tokens per second)
llama_print_timings: prompt eval time =     948.24 ms /    10 tokens (   94.82 ms per token,    10.55 tokens per second)
llama_print_timings:        eval time =   17620.46 ms /    99 runs   (  177.98 ms per token,     5.62 tokens per second)
llama_print_timings:       total time =   18875.07 ms /   109 tokens
Subscribe & Save

0.6 0.3 0.2 0.1 0.1 0.1 0.1 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.29 ms /   100 runs   (    0.22 ms per token,  4486.52 tokens per second)
llama_print_timings: prompt eval time =     885.90 ms /    11 tokens (   80.54 ms per token,    12.42 tokens per second)
llama_print_timings:        eval time =   17323.67 ms /    99 runs   (  174.99 ms per token,     5.71 tokens per second)
llama_print_timings:       total time =   18510.22 ms /   110 tokens
Your Amazon Cart is empty

0.2 0.1 0.3 0.2 0.1 0.2 0.1 0.2 0.2 0.2
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.31 ms /   100 runs   (    0.22 ms per token,  4482.90 tokens per second)
llama_print_timings: prompt eval time =    1205.34 ms /    12 tokens (  100.45 ms per token,     9.96 tokens per second)
llama_print_timings:        eval time =   17385.28 ms /    99 runs   (  175.61 ms per token,     5.69 tokens per second)
llama_print_timings:       total time =   18892.30 ms /   111 tokens
Shop todays deals

0.2 0.3 0.1 0.3 0.1 0.1 0.15 0.15
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.25 ms /   100 runs   (    0.22 ms per token,  4493.37 tokens per second)
llama_print_timings: prompt eval time =     892.06 ms /    11 tokens (   81.10 ms per token,    12.33 tokens per second)
llama_print_timings:        eval time =   17659.99 ms /    99 runs   (  178.38 ms per token,     5.61 tokens per second)
llama_print_timings:       total time =   18853.07 ms /   110 tokens
Sign in to your account

0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.23 ms /   100 runs   (    0.22 ms per token,  4499.24 tokens per second)
llama_print_timings: prompt eval time =     672.42 ms /     8 tokens (   84.05 ms per token,    11.90 tokens per second)
llama_print_timings:        eval time =   17385.50 ms /    99 runs   (  175.61 ms per token,     5.69 tokens per second)
llama_print_timings:       total time =   18358.15 ms /   107 tokens
Sign up now

0.8 0.2 0.1 0.4 0.3 0.1 0.1 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.32 ms /   100 runs   (    0.22 ms per token,  4481.09 tokens per second)
llama_print_timings: prompt eval time =     912.94 ms /    11 tokens (   82.99 ms per token,    12.05 tokens per second)
llama_print_timings:        eval time =   17306.07 ms /    99 runs   (  174.81 ms per token,     5.72 tokens per second)
llama_print_timings:       total time =   18519.46 ms /   110 tokens
No items saved for later

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      14.91 ms /    67 runs   (    0.22 ms per token,  4493.03 tokens per second)
llama_print_timings: prompt eval time =    3766.85 ms /    48 tokens (   78.48 ms per token,    12.74 tokens per second)
llama_print_timings:        eval time =   11740.93 ms /    66 runs   (  177.89 ms per token,     5.62 tokens per second)
llama_print_timings:       total time =   15707.23 ms /   114 tokens
The price and availability of items at Amazon.in are subject to change. The shopping cart is a temporary place to store a list of your items and reflects each item's most recent price.

0.8 0.65 0.55 0.55 0.55 0.55 0.55 0.55 0.55 0.55 0.55
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.25 ms /   100 runs   (    0.22 ms per token,  4493.98 tokens per second)
llama_print_timings: prompt eval time =    2957.87 ms /    33 tokens (   89.63 ms per token,    11.16 tokens per second)
llama_print_timings:        eval time =   17434.18 ms /    99 runs   (  176.10 ms per token,     5.68 tokens per second)
llama_print_timings:       total time =   20693.81 ms /   132 tokens
Do you have a promotional code? We'll ask you to enter your claim code when it's time to pay.

0.2 0.1 0.1 0.2 0.1 0.1 0.1 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.33 ms /   100 runs   (    0.22 ms per token,  4477.48 tokens per second)
llama_print_timings: prompt eval time =    3116.93 ms /    30 tokens (  103.90 ms per token,     9.62 tokens per second)
llama_print_timings:        eval time =   17462.75 ms /    99 runs   (  176.39 ms per token,     5.67 tokens per second)
llama_print_timings:       total time =   20880.79 ms /   129 tokens
Brief content visible, double tap to read full content.Full content visible, double tap to read brief content.

0.75 0.35 0.25 0.55 0.35 0.45 0.25 0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.22 ms /   100 runs   (    0.22 ms per token,  4500.05 tokens per second)
llama_print_timings: prompt eval time =    1504.18 ms /    14 tokens (  107.44 ms per token,     9.31 tokens per second)
llama_print_timings:        eval time =   17500.23 ms /    99 runs   (  176.77 ms per token,     5.66 tokens per second)
llama_print_timings:       total time =   19306.14 ms /   113 tokens
Your recently viewed items and featured recommendations

0.5 0.2 0.1 0.4 0.3 0.1 0.1 0.1 0.2 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      12.01 ms /    54 runs   (    0.22 ms per token,  4495.88 tokens per second)
llama_print_timings: prompt eval time =    1077.73 ms /    13 tokens (   82.90 ms per token,    12.06 tokens per second)
llama_print_timings:        eval time =    9572.19 ms /    53 runs   (  180.61 ms per token,     5.54 tokens per second)
llama_print_timings:       total time =   10809.71 ms /    66 tokens
View or edit your browsing history

0.3 0.25 0.15 0.25 0.15 0.1 0.25 0.15 0.25
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.29 ms /   100 runs   (    0.22 ms per token,  4486.32 tokens per second)
llama_print_timings: prompt eval time =    2729.10 ms /    30 tokens (   90.97 ms per token,    10.99 tokens per second)
llama_print_timings:        eval time =   17470.08 ms /    99 runs   (  176.47 ms per token,     5.67 tokens per second)
llama_print_timings:       total time =   20506.25 ms /   129 tokens
After viewing product detail pages, look here to find an easy way to navigate back to pages you are interested in.

0.05 0.12 0.08 0.20 0.02 0.07 0.06 0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      23.26 ms /   100 runs   (    0.23 ms per token,  4299.60 tokens per second)
llama_print_timings: prompt eval time =    1564.93 ms /    14 tokens (  111.78 ms per token,     8.95 tokens per second)
llama_print_timings:        eval time =   17555.23 ms /    99 runs   (  177.33 ms per token,     5.64 tokens per second)
llama_print_timings:       total time =   19432.07 ms /   113 tokens
Your recently viewed items and featured recommendations

0.15 0.20 0.10 0.10 0.15 0.25 0.10 0.10 0.10
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.34 ms /   100 runs   (    0.22 ms per token,  4476.08 tokens per second)
llama_print_timings: prompt eval time =    1053.09 ms /    13 tokens (   81.01 ms per token,    12.34 tokens per second)
llama_print_timings:        eval time =   17600.17 ms /    99 runs   (  177.78 ms per token,     5.62 tokens per second)
llama_print_timings:       total time =   18954.90 ms /   112 tokens
View or edit your browsing history

0.15 0.18 0.12 0.20 0.06 0.19 0.07 0.05 0.0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.22 ms /   100 runs   (    0.22 ms per token,  4500.05 tokens per second)
llama_print_timings: prompt eval time =    2346.95 ms /    30 tokens (   78.23 ms per token,    12.78 tokens per second)
llama_print_timings:        eval time =   17679.84 ms /    99 runs   (  178.58 ms per token,     5.60 tokens per second)
llama_print_timings:       total time =   20327.71 ms /   129 tokens
After viewing product detail pages, look here to find an easy way to navigate back to pages you are interested in.

0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.30 ms /   100 runs   (    0.22 ms per token,  4484.10 tokens per second)
llama_print_timings: prompt eval time =     758.33 ms /     9 tokens (   84.26 ms per token,    11.87 tokens per second)
llama_print_timings:        eval time =   17926.59 ms /    99 runs   (  181.08 ms per token,     5.52 tokens per second)
llama_print_timings:       total time =   18986.03 ms /   108 tokens
Back to top

0.10 0.05 0.05 0.15 0.05 0.10 0.05 0.05
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      13.82 ms /    62 runs   (    0.22 ms per token,  4485.93 tokens per second)
llama_print_timings: prompt eval time =     963.59 ms /    10 tokens (   96.36 ms per token,    10.38 tokens per second)
llama_print_timings:        eval time =   10819.53 ms /    61 runs   (  177.37 ms per token,     5.64 tokens per second)
llama_print_timings:       total time =   11967.97 ms /    71 tokens
Get to Know Us

0.33 0.25 0.17 0.17 0.17 0.13 0.13 0.08 0.08 0.08
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      23.28 ms /   100 runs   (    0.23 ms per token,  4294.98 tokens per second)
llama_print_timings: prompt eval time =     740.38 ms /     9 tokens (   82.26 ms per token,    12.16 tokens per second)
llama_print_timings:        eval time =   17796.88 ms /    99 runs   (  179.77 ms per token,     5.56 tokens per second)
llama_print_timings:       total time =   18847.82 ms /   108 tokens
Connect with Us

0.75 0.15 0.05 0.05 0.05 0.05 0.05 0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.24 ms /   100 runs   (    0.22 ms per token,  4496.61 tokens per second)
llama_print_timings: prompt eval time =     894.47 ms /    11 tokens (   81.32 ms per token,    12.30 tokens per second)
llama_print_timings:        eval time =   17334.89 ms /    99 runs   (  175.10 ms per token,     5.71 tokens per second)
llama_print_timings:       total time =   18531.04 ms /   110 tokens
Make Money with Us

0.7 0.3 0.2 0.6 0.5 0.4 0.1 0.2 0.8 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.30 ms /   100 runs   (    0.22 ms per token,  4483.70 tokens per second)
llama_print_timings: prompt eval time =    1112.80 ms /    10 tokens (  111.28 ms per token,     8.99 tokens per second)
llama_print_timings:        eval time =   17450.44 ms /    99 runs   (  176.27 ms per token,     5.67 tokens per second)
llama_print_timings:       total time =   18864.78 ms /   109 tokens
Sell on Amazon

0.3 0.2 0.1 0.15 0.1 0.15 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.28 ms /   100 runs   (    0.22 ms per token,  4488.33 tokens per second)
llama_print_timings: prompt eval time =     902.50 ms /    11 tokens (   82.05 ms per token,    12.19 tokens per second)
llama_print_timings:        eval time =   17522.78 ms /    99 runs   (  177.00 ms per token,     5.65 tokens per second)
llama_print_timings:       total time =   18726.00 ms /   110 tokens
Sell under Amazon Accelerator

0.2 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.30 ms /   100 runs   (    0.22 ms per token,  4485.31 tokens per second)
llama_print_timings: prompt eval time =    1042.43 ms /    13 tokens (   80.19 ms per token,    12.47 tokens per second)
llama_print_timings:        eval time =   17532.73 ms /    99 runs   (  177.10 ms per token,     5.65 tokens per second)
llama_print_timings:       total time =   18876.46 ms /   112 tokens
Protect and Build Your Brand

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.1.
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.34 ms /   100 runs   (    0.22 ms per token,  4477.28 tokens per second)
llama_print_timings: prompt eval time =     983.77 ms /    12 tokens (   81.98 ms per token,    12.20 tokens per second)
llama_print_timings:        eval time =   17423.15 ms /    99 runs   (  175.99 ms per token,     5.68 tokens per second)
llama_print_timings:       total time =   18708.64 ms /   111 tokens
Amazon Global Selling

0.75 0.55 0.45 0.65 0.45 0.55 0.45 0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      23.21 ms /   100 runs   (    0.23 ms per token,  4307.75 tokens per second)
llama_print_timings: prompt eval time =     976.40 ms /    12 tokens (   81.37 ms per token,    12.29 tokens per second)
llama_print_timings:        eval time =   17870.15 ms /    99 runs   (  180.51 ms per token,     5.54 tokens per second)
llama_print_timings:       total time =   19159.30 ms /   111 tokens
Become an Affiliate

0.25 0.15 0.1 0.3 0.1 0.1 0.15 0.2 0.1 0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.34 ms /   100 runs   (    0.22 ms per token,  4476.68 tokens per second)
llama_print_timings: prompt eval time =     989.77 ms /    12 tokens (   82.48 ms per token,    12.12 tokens per second)
llama_print_timings:        eval time =   17304.06 ms /    99 runs   (  174.79 ms per token,     5.72 tokens per second)
llama_print_timings:       total time =   18595.41 ms /   111 tokens
Fulfilment by Amazon

0.3 0.2 0.15 0.25 0.15 0.1 0.15 0.15
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.23 ms /   100 runs   (    0.22 ms per token,  4498.22 tokens per second)
llama_print_timings: prompt eval time =     956.35 ms /    12 tokens (   79.70 ms per token,    12.55 tokens per second)
llama_print_timings:        eval time =   17270.80 ms /    99 runs   (  174.45 ms per token,     5.73 tokens per second)
llama_print_timings:       total time =   18528.87 ms /   111 tokens
Advertise Your Products

0.2 0.1 0.1 0.3 0.2 0.1 0.1 0.2 0.2 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.20 ms /   100 runs   (    0.22 ms per token,  4504.91 tokens per second)
llama_print_timings: prompt eval time =    1216.50 ms /    14 tokens (   86.89 ms per token,    11.51 tokens per second)
llama_print_timings:        eval time =   17314.41 ms /    99 runs   (  174.89 ms per token,     5.72 tokens per second)
llama_print_timings:       total time =   18831.70 ms /   113 tokens
Amazon Pay on Merchants

0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.37 ms /   100 runs   (    0.22 ms per token,  4470.67 tokens per second)
llama_print_timings: prompt eval time =     804.34 ms /    10 tokens (   80.43 ms per token,    12.43 tokens per second)
llama_print_timings:        eval time =   17792.54 ms /    99 runs   (  179.72 ms per token,     5.56 tokens per second)
llama_print_timings:       total time =   18900.65 ms /   109 tokens
Let Us Help You

0.5 0.2 0.3 0.4 0.1 0.1 0.1 0.1 0.1 0.2
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.89 ms /   100 runs   (    0.23 ms per token,  4368.34 tokens per second)
llama_print_timings: prompt eval time =    1224.08 ms /    13 tokens (   94.16 ms per token,    10.62 tokens per second)
llama_print_timings:        eval time =   18778.40 ms /    99 runs   (  189.68 ms per token,     5.27 tokens per second)
llama_print_timings:       total time =   20313.04 ms /   112 tokens
COVID-19 and Amazon

0.8 0.3 0.1 0.5 0.2 0.6 0.1 0.2 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.34 ms /   100 runs   (    0.22 ms per token,  4475.67 tokens per second)
llama_print_timings: prompt eval time =    1198.08 ms /    14 tokens (   85.58 ms per token,    11.69 tokens per second)
llama_print_timings:        eval time =   17632.99 ms /    99 runs   (  178.11 ms per token,     5.61 tokens per second)
llama_print_timings:       total time =   19133.52 ms /   113 tokens
100% Purchase Protection

0.5 0.3 0.3 0.2 0.2 0.1 0.1 0.1 0.1 0.
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      12.56 ms /    56 runs   (    0.22 ms per token,  4460.02 tokens per second)
llama_print_timings: prompt eval time =     907.08 ms /    11 tokens (   82.46 ms per token,    12.13 tokens per second)
llama_print_timings:        eval time =    9586.78 ms /    55 runs   (  174.31 ms per token,     5.74 tokens per second)
llama_print_timings:       total time =   10660.67 ms /    66 tokens
Amazon App Download

0.3 0.2 0.15 0.25 0.1 0.1 0.15 0.2 0.15 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.18 ms /   100 runs   (    0.22 ms per token,  4507.55 tokens per second)
llama_print_timings: prompt eval time =    3995.39 ms /    51 tokens (   78.34 ms per token,    12.76 tokens per second)
llama_print_timings:        eval time =   17487.53 ms /    99 runs   (  176.64 ms per token,     5.66 tokens per second)
llama_print_timings:       total time =   21786.32 ms /   150 tokens
AustraliaBrazilCanadaChinaFranceGermanyItalyJapanMexicoNetherlandsPolandSingaporeSpainTurkeyUnited Arab EmiratesUnited KingdomUnited States

0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.28 ms /   100 runs   (    0.22 ms per token,  4488.33 tokens per second)
llama_print_timings: prompt eval time =    1536.50 ms /    17 tokens (   90.38 ms per token,    11.06 tokens per second)
llama_print_timings:        eval time =   17697.05 ms /    99 runs   (  178.76 ms per token,     5.59 tokens per second)
llama_print_timings:       total time =   19535.58 ms /   116 tokens
AbeBooksBooks, art& collectibles

0.15 0.25 0.10 0.30 0.05 0.10 0.05 0
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.34 ms /   100 runs   (    0.22 ms per token,  4476.48 tokens per second)
llama_print_timings: prompt eval time =    1404.17 ms /    16 tokens (   87.76 ms per token,    11.39 tokens per second)
llama_print_timings:        eval time =   18123.89 ms /    99 runs   (  183.07 ms per token,     5.46 tokens per second)
llama_print_timings:       total time =   19831.41 ms /   115 tokens
Amazon Web ServicesScalable CloudComputing Services

0.2 0.1 0.1 0.3 0.2 0.1 0.1 0.1 0.1 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.22 ms /   100 runs   (    0.22 ms per token,  4500.65 tokens per second)
llama_print_timings: prompt eval time =    1464.35 ms /    18 tokens (   81.35 ms per token,    12.29 tokens per second)
llama_print_timings:        eval time =   17333.82 ms /    99 runs   (  175.09 ms per token,     5.71 tokens per second)
llama_print_timings:       total time =   19099.87 ms /   117 tokens
IMDbMovies, TV& Celebrities

0.3 0.2 0.1 0.4 0.1 0.2 0.1 0.1 0.3 0.3
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.70 ms /   100 runs   (    0.23 ms per token,  4406.06 tokens per second)
llama_print_timings: prompt eval time =    1285.68 ms /    15 tokens (   85.71 ms per token,    11.67 tokens per second)
llama_print_timings:        eval time =   17498.15 ms /    99 runs   (  176.75 ms per token,     5.66 tokens per second)
llama_print_timings:       total time =   19091.17 ms /   114 tokens
Amazon BusinessEverything ForYour Business

0.8 0.7 0.5 0.6 0.4 0.5 0.3 0.6 0.7 0.4
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.30 ms /   100 runs   (    0.22 ms per token,  4484.10 tokens per second)
llama_print_timings: prompt eval time =    1601.38 ms /    20 tokens (   80.07 ms per token,    12.49 tokens per second)
llama_print_timings:        eval time =   17621.39 ms /    99 runs   (  177.99 ms per token,     5.62 tokens per second)
llama_print_timings:       total time =   19524.66 ms /   119 tokens
Prime Now 2-Hour Deliveryon Everyday Items

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.1
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      22.41 ms /   100 runs   (    0.22 ms per token,  4461.50 tokens per second)
llama_print_timings: prompt eval time =    2204.29 ms /    28 tokens (   78.72 ms per token,    12.70 tokens per second)
llama_print_timings:        eval time =   17390.42 ms /    99 runs   (  175.66 ms per token,     5.69 tokens per second)
llama_print_timings:       total time =   19897.99 ms /   127 tokens
Amazon Prime Music100 million songs, ad-freeOver 15 million podcast episodes

0.85 0.15 0.05 0.10 0.30 0.15 0.05 0.10 0.20
Llama.generate: prefix-match hit

llama_print_timings:        load time =    8252.00 ms
llama_print_timings:      sample time =      23.25 ms /   100 runs   (    0.23 ms per token,  4302.00 tokens per second)
llama_print_timings: prompt eval time =    4402.56 ms /    42 tokens (  104.82 ms per token,     9.54 tokens per second)
llama_print_timings:        eval time =   17585.04 ms /    99 runs   (  177.63 ms per token,     5.63 tokens per second)
llama_print_timings:       total time =   22301.98 ms /   141 tokens
Conditions of Use & Sale Privacy Notice Interest-Based Ads  1996-2024, Amazon.com, Inc. or its affiliates
0.1 0.2 0.1 0.2 0.1 0.2 0.1 0.1 0.1 0.1