Fix for CD emulation stopping the SCSI drive during load/eject requests
[SCSI2SD-V6.git] / src / firmware / disk.c
1 //    Copyright (C) 2013 Michael McMaster <michael@codesrc.com>\r
2 //    Copyright (C) 2014 Doug Brown <doug@downtowndougbrown.com>\r
3 //\r
4 //    This file is part of SCSI2SD.\r
5 //\r
6 //    SCSI2SD is free software: you can redistribute it and/or modify\r
7 //    it under the terms of the GNU General Public License as published by\r
8 //    the Free Software Foundation, either version 3 of the License, or\r
9 //    (at your option) any later version.\r
10 //\r
11 //    SCSI2SD is distributed in the hope that it will be useful,\r
12 //    but WITHOUT ANY WARRANTY; without even the implied warranty of\r
13 //    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the\r
14 //    GNU General Public License for more details.\r
15 //\r
16 //    You should have received a copy of the GNU General Public License\r
17 //    along with SCSI2SD.  If not, see <http://www.gnu.org/licenses/>.\r
18 \r
19 #ifdef STM32F2xx\r
20 #include "stm32f2xx.h"\r
21 #endif\r
22 #ifdef STM32F4xx\r
23 #include "stm32f4xx.h"\r
24 #endif\r
25 \r
26 #include <assert.h>\r
27 \r
28 // For SD write direct routines\r
29 #include "sdio.h"\r
30 #include "bsp_driver_sd.h"\r
31 \r
32 \r
33 #include "scsi.h"\r
34 #include "scsiPhy.h"\r
35 #include "config.h"\r
36 #include "disk.h"\r
37 #include "sd.h"\r
38 #include "time.h"\r
39 #include "bsp.h"\r
40 \r
41 #include <string.h>\r
42 \r
43 // Global\r
44 BlockDevice blockDev;\r
45 Transfer transfer;\r
46 \r
47 static int doSdInit()\r
48 {\r
49     int result = 0;\r
50     if (blockDev.state & DISK_PRESENT)\r
51     {\r
52         blockDev.state = blockDev.state | DISK_INITIALISED;\r
53     }\r
54     return result;\r
55 }\r
56 \r
57 // Callback once all data has been read in the data out phase.\r
58 static void doFormatUnitComplete(void)\r
59 {\r
60     // TODO start writing the initialisation pattern to the SD\r
61     // card\r
62     scsiDev.phase = STATUS;\r
63 }\r
64 \r
65 static void doFormatUnitSkipData(int bytes)\r
66 {\r
67     // We may not have enough memory to store the initialisation pattern and\r
68     // defect list data.  Since we're not making use of it yet anyway, just\r
69     // discard the bytes.\r
70     scsiEnterPhase(DATA_OUT);\r
71     int i;\r
72     for (i = 0; i < bytes; ++i)\r
73     {\r
74         scsiReadByte();\r
75     }\r
76 }\r
77 \r
78 // Callback from the data out phase.\r
79 static void doFormatUnitPatternHeader(void)\r
80 {\r
81     int defectLength =\r
82         ((((uint16_t)scsiDev.data[2])) << 8) +\r
83             scsiDev.data[3];\r
84 \r
85     int patternLength =\r
86         ((((uint16_t)scsiDev.data[4 + 2])) << 8) +\r
87         scsiDev.data[4 + 3];\r
88 \r
89         doFormatUnitSkipData(defectLength + patternLength);\r
90         doFormatUnitComplete();\r
91 }\r
92 \r
93 // Callback from the data out phase.\r
94 static void doFormatUnitHeader(void)\r
95 {\r
96     int IP = (scsiDev.data[1] & 0x08) ? 1 : 0;\r
97     int DSP = (scsiDev.data[1] & 0x04) ? 1 : 0;\r
98 \r
99     if (! DSP) // disable save parameters\r
100     {\r
101         // Save the "MODE SELECT savable parameters"\r
102         s2s_configSave(\r
103             scsiDev.target->targetId,\r
104             scsiDev.target->liveCfg.bytesPerSector);\r
105     }\r
106 \r
107     if (IP)\r
108     {\r
109         // We need to read the initialisation pattern header first.\r
110         scsiDev.dataLen += 4;\r
111         scsiDev.phase = DATA_OUT;\r
112         scsiDev.postDataOutHook = doFormatUnitPatternHeader;\r
113     }\r
114     else\r
115     {\r
116         // Read the defect list data\r
117         int defectLength =\r
118             ((((uint16_t)scsiDev.data[2])) << 8) +\r
119             scsiDev.data[3];\r
120         doFormatUnitSkipData(defectLength);\r
121         doFormatUnitComplete();\r
122     }\r
123 }\r
124 \r
125 static void doReadCapacity()\r
126 {\r
127     uint32_t lba = (((uint32_t) scsiDev.cdb[2]) << 24) +\r
128         (((uint32_t) scsiDev.cdb[3]) << 16) +\r
129         (((uint32_t) scsiDev.cdb[4]) << 8) +\r
130         scsiDev.cdb[5];\r
131     int pmi = scsiDev.cdb[8] & 1;\r
132 \r
133     uint32_t capacity = getScsiCapacity(\r
134         scsiDev.target->cfg->sdSectorStart,\r
135         scsiDev.target->liveCfg.bytesPerSector,\r
136         scsiDev.target->cfg->scsiSectors);\r
137 \r
138     if (!pmi && lba)\r
139     {\r
140         // error.\r
141         // We don't do anything with the "partial medium indicator", and\r
142         // assume that delays are constant across each block. But the spec\r
143         // says we must return this error if pmi is specified incorrectly.\r
144         scsiDev.status = CHECK_CONDITION;\r
145         scsiDev.target->sense.code = ILLEGAL_REQUEST;\r
146         scsiDev.target->sense.asc = INVALID_FIELD_IN_CDB;\r
147         scsiDev.phase = STATUS;\r
148     }\r
149     else if (capacity > 0)\r
150     {\r
151         uint32_t highestBlock = capacity - 1;\r
152 \r
153         scsiDev.data[0] = highestBlock >> 24;\r
154         scsiDev.data[1] = highestBlock >> 16;\r
155         scsiDev.data[2] = highestBlock >> 8;\r
156         scsiDev.data[3] = highestBlock;\r
157 \r
158         uint32_t bytesPerSector = scsiDev.target->liveCfg.bytesPerSector;\r
159         scsiDev.data[4] = bytesPerSector >> 24;\r
160         scsiDev.data[5] = bytesPerSector >> 16;\r
161         scsiDev.data[6] = bytesPerSector >> 8;\r
162         scsiDev.data[7] = bytesPerSector;\r
163         scsiDev.dataLen = 8;\r
164         scsiDev.phase = DATA_IN;\r
165     }\r
166     else\r
167     {\r
168         scsiDev.status = CHECK_CONDITION;\r
169         scsiDev.target->sense.code = NOT_READY;\r
170         scsiDev.target->sense.asc = MEDIUM_NOT_PRESENT;\r
171         scsiDev.phase = STATUS;\r
172     }\r
173 }\r
174 \r
175 static void doWrite(uint32_t lba, uint32_t blocks)\r
176 {\r
177     if (unlikely(scsiDev.target->cfg->deviceType == S2S_CFG_FLOPPY_14MB)) {\r
178         // Floppies are supposed to be slow. Some systems can't handle a floppy\r
179         // without an access time\r
180         s2s_delay_ms(10);\r
181     }\r
182 \r
183     uint32_t bytesPerSector = scsiDev.target->liveCfg.bytesPerSector;\r
184 \r
185     if (unlikely(blockDev.state & DISK_WP) ||\r
186         unlikely(scsiDev.target->cfg->deviceType == S2S_CFG_OPTICAL))\r
187 \r
188     {\r
189         scsiDev.status = CHECK_CONDITION;\r
190         scsiDev.target->sense.code = ILLEGAL_REQUEST;\r
191         scsiDev.target->sense.asc = WRITE_PROTECTED;\r
192         scsiDev.phase = STATUS;\r
193     }\r
194     else if (unlikely(((uint64_t) lba) + blocks >\r
195         getScsiCapacity(\r
196             scsiDev.target->cfg->sdSectorStart,\r
197             bytesPerSector,\r
198             scsiDev.target->cfg->scsiSectors\r
199             )\r
200         ))\r
201     {\r
202         scsiDev.status = CHECK_CONDITION;\r
203         scsiDev.target->sense.code = ILLEGAL_REQUEST;\r
204         scsiDev.target->sense.asc = LOGICAL_BLOCK_ADDRESS_OUT_OF_RANGE;\r
205         scsiDev.phase = STATUS;\r
206     }\r
207     else\r
208     {\r
209         transfer.lba = lba;\r
210         transfer.blocks = blocks;\r
211         transfer.currentBlock = 0;\r
212         scsiDev.phase = DATA_OUT;\r
213         scsiDev.dataLen = bytesPerSector;\r
214         scsiDev.dataPtr = bytesPerSector;\r
215 \r
216         // No need for single-block writes atm.  Overhead of the\r
217         // multi-block write is minimal.\r
218         transfer.multiBlock = 1;\r
219 \r
220 \r
221         // TODO uint32_t sdLBA =\r
222 // TODO             SCSISector2SD(\r
223     // TODO             scsiDev.target->cfg->sdSectorStart,\r
224         // TODO         bytesPerSector,\r
225             // TODO     lba);\r
226         // TODO uint32_t sdBlocks = blocks * SDSectorsPerSCSISector(bytesPerSector);\r
227         // TODO sdWriteMultiSectorPrep(sdLBA, sdBlocks);\r
228     }\r
229 }\r
230 \r
231 \r
232 static void doRead(uint32_t lba, uint32_t blocks)\r
233 {\r
234     if (unlikely(scsiDev.target->cfg->deviceType == S2S_CFG_FLOPPY_14MB)) {\r
235         // Floppies are supposed to be slow. Some systems can't handle a floppy\r
236         // without an access time\r
237         s2s_delay_ms(10);\r
238     }\r
239 \r
240     uint32_t capacity = getScsiCapacity(\r
241         scsiDev.target->cfg->sdSectorStart,\r
242         scsiDev.target->liveCfg.bytesPerSector,\r
243         scsiDev.target->cfg->scsiSectors);\r
244     if (unlikely(((uint64_t) lba) + blocks > capacity))\r
245     {\r
246         scsiDev.status = CHECK_CONDITION;\r
247         scsiDev.target->sense.code = ILLEGAL_REQUEST;\r
248         scsiDev.target->sense.asc = LOGICAL_BLOCK_ADDRESS_OUT_OF_RANGE;\r
249         scsiDev.phase = STATUS;\r
250     }\r
251     else\r
252     {\r
253         transfer.lba = lba;\r
254         transfer.blocks = blocks;\r
255         transfer.currentBlock = 0;\r
256         scsiDev.phase = DATA_IN;\r
257         scsiDev.dataLen = 0; // No data yet\r
258 \r
259         uint32_t bytesPerSector = scsiDev.target->liveCfg.bytesPerSector;\r
260         uint32_t sdSectorPerSCSISector = SDSectorsPerSCSISector(bytesPerSector);\r
261         uint32_t sdSectors =\r
262             blocks * sdSectorPerSCSISector;\r
263 \r
264         if ((\r
265                 (sdSectors == 1) &&\r
266                 !(scsiDev.boardCfg.flags & S2S_CFG_ENABLE_CACHE)\r
267             ) ||\r
268             unlikely(((uint64_t) lba) + blocks == capacity)\r
269             )\r
270         {\r
271             // We get errors on reading the last sector using a multi-sector\r
272             // read :-(\r
273             transfer.multiBlock = 0;\r
274         }\r
275         else\r
276         {\r
277             transfer.multiBlock = 1;\r
278 \r
279             // uint32_t sdLBA =\r
280                 // SCSISector2SD(\r
281                     // scsiDev.target->cfg->sdSectorStart,\r
282                     // bytesPerSector,\r
283                     // lba);\r
284 \r
285             // TODO sdReadMultiSectorPrep(sdLBA, sdSectors);\r
286         }\r
287     }\r
288 }\r
289 \r
290 static void doSeek(uint32_t lba)\r
291 {\r
292     if (lba >=\r
293         getScsiCapacity(\r
294             scsiDev.target->cfg->sdSectorStart,\r
295             scsiDev.target->liveCfg.bytesPerSector,\r
296             scsiDev.target->cfg->scsiSectors)\r
297         )\r
298     {\r
299         scsiDev.status = CHECK_CONDITION;\r
300         scsiDev.target->sense.code = ILLEGAL_REQUEST;\r
301         scsiDev.target->sense.asc = LOGICAL_BLOCK_ADDRESS_OUT_OF_RANGE;\r
302         scsiDev.phase = STATUS;\r
303     }\r
304     else\r
305     {\r
306         s2s_delay_ms(10);\r
307     }\r
308 }\r
309 \r
310 static int doTestUnitReady()\r
311 {\r
312     int ready = 1;\r
313     if (likely(blockDev.state == (DISK_STARTED | DISK_PRESENT | DISK_INITIALISED)))\r
314     {\r
315         // nothing to do.\r
316     }\r
317     else if (unlikely(!(blockDev.state & DISK_STARTED)))\r
318     {\r
319         ready = 0;\r
320         scsiDev.status = CHECK_CONDITION;\r
321         scsiDev.target->sense.code = NOT_READY;\r
322         scsiDev.target->sense.asc = LOGICAL_UNIT_NOT_READY_INITIALIZING_COMMAND_REQUIRED;\r
323         scsiDev.phase = STATUS;\r
324     }\r
325     else if (unlikely(!(blockDev.state & DISK_PRESENT)))\r
326     {\r
327         ready = 0;\r
328         scsiDev.status = CHECK_CONDITION;\r
329         scsiDev.target->sense.code = NOT_READY;\r
330         scsiDev.target->sense.asc = MEDIUM_NOT_PRESENT;\r
331         scsiDev.phase = STATUS;\r
332     }\r
333     else if (unlikely(!(blockDev.state & DISK_INITIALISED)))\r
334     {\r
335         ready = 0;\r
336         scsiDev.status = CHECK_CONDITION;\r
337         scsiDev.target->sense.code = NOT_READY;\r
338         scsiDev.target->sense.asc = LOGICAL_UNIT_NOT_READY_CAUSE_NOT_REPORTABLE;\r
339         scsiDev.phase = STATUS;\r
340     }\r
341     return ready;\r
342 }\r
343 \r
344 // Handle direct-access scsi device commands\r
345 int scsiDiskCommand()\r
346 {\r
347     int commandHandled = 1;\r
348 \r
349     uint8_t command = scsiDev.cdb[0];\r
350     if (unlikely(command == 0x1B))\r
351     {\r
352         // START STOP UNIT\r
353         // Enable or disable media access operations.\r
354         //int immed = scsiDev.cdb[1] & 1;\r
355         int start = scsiDev.cdb[4] & 1;\r
356         int loadEject = scsiDev.cdb[4] & 2;\r
357         \r
358         if (loadEject)\r
359         {\r
360             // Ignore load/eject requests. We can't do that.\r
361         }\r
362         else if (start)\r
363         {\r
364             blockDev.state = blockDev.state | DISK_STARTED;\r
365             if (!(blockDev.state & DISK_INITIALISED))\r
366             {\r
367                 doSdInit();\r
368             }\r
369         }\r
370         else\r
371         {\r
372             blockDev.state &= ~DISK_STARTED;\r
373         }\r
374     }\r
375     else if (unlikely(command == 0x00))\r
376     {\r
377         // TEST UNIT READY\r
378         doTestUnitReady();\r
379     }\r
380     else if (unlikely(!doTestUnitReady()))\r
381     {\r
382         // Status and sense codes already set by doTestUnitReady\r
383     }\r
384     else if (likely(command == 0x08))\r
385     {\r
386         // READ(6)\r
387         uint32_t lba =\r
388             (((uint32_t) scsiDev.cdb[1] & 0x1F) << 16) +\r
389             (((uint32_t) scsiDev.cdb[2]) << 8) +\r
390             scsiDev.cdb[3];\r
391         uint32_t blocks = scsiDev.cdb[4];\r
392         if (unlikely(blocks == 0)) blocks = 256;\r
393         doRead(lba, blocks);\r
394     }\r
395     else if (likely(command == 0x28))\r
396     {\r
397         // READ(10)\r
398         // Ignore all cache control bits - we don't support a memory cache.\r
399 \r
400         uint32_t lba =\r
401             (((uint32_t) scsiDev.cdb[2]) << 24) +\r
402             (((uint32_t) scsiDev.cdb[3]) << 16) +\r
403             (((uint32_t) scsiDev.cdb[4]) << 8) +\r
404             scsiDev.cdb[5];\r
405         uint32_t blocks =\r
406             (((uint32_t) scsiDev.cdb[7]) << 8) +\r
407             scsiDev.cdb[8];\r
408 \r
409         doRead(lba, blocks);\r
410     }\r
411     else if (likely(command == 0x0A))\r
412     {\r
413         // WRITE(6)\r
414         uint32_t lba =\r
415             (((uint32_t) scsiDev.cdb[1] & 0x1F) << 16) +\r
416             (((uint32_t) scsiDev.cdb[2]) << 8) +\r
417             scsiDev.cdb[3];\r
418         uint32_t blocks = scsiDev.cdb[4];\r
419         if (unlikely(blocks == 0)) blocks = 256;\r
420         doWrite(lba, blocks);\r
421     }\r
422     else if (likely(command == 0x2A) || // WRITE(10)\r
423         unlikely(command == 0x2E)) // WRITE AND VERIFY\r
424     {\r
425         // Ignore all cache control bits - we don't support a memory cache.\r
426         // Don't bother verifying either. The SD card likely stores ECC\r
427         // along with each flash row.\r
428 \r
429         uint32_t lba =\r
430             (((uint32_t) scsiDev.cdb[2]) << 24) +\r
431             (((uint32_t) scsiDev.cdb[3]) << 16) +\r
432             (((uint32_t) scsiDev.cdb[4]) << 8) +\r
433             scsiDev.cdb[5];\r
434         uint32_t blocks =\r
435             (((uint32_t) scsiDev.cdb[7]) << 8) +\r
436             scsiDev.cdb[8];\r
437 \r
438         doWrite(lba, blocks);\r
439     }\r
440     else if (unlikely(command == 0x04))\r
441     {\r
442         // FORMAT UNIT\r
443         // We don't really do any formatting, but we need to read the correct\r
444         // number of bytes in the DATA_OUT phase to make the SCSI host happy.\r
445 \r
446         int fmtData = (scsiDev.cdb[1] & 0x10) ? 1 : 0;\r
447         if (fmtData)\r
448         {\r
449             // We need to read the parameter list, but we don't know how\r
450             // big it is yet. Start with the header.\r
451             scsiDev.dataLen = 4;\r
452             scsiDev.phase = DATA_OUT;\r
453             scsiDev.postDataOutHook = doFormatUnitHeader;\r
454         }\r
455         else\r
456         {\r
457             // No data to read, we're already finished!\r
458         }\r
459     }\r
460     else if (unlikely(command == 0x25))\r
461     {\r
462         // READ CAPACITY\r
463         doReadCapacity();\r
464     }\r
465     else if (unlikely(command == 0x0B))\r
466     {\r
467         // SEEK(6)\r
468         uint32_t lba =\r
469             (((uint32_t) scsiDev.cdb[1] & 0x1F) << 16) +\r
470             (((uint32_t) scsiDev.cdb[2]) << 8) +\r
471             scsiDev.cdb[3];\r
472 \r
473         doSeek(lba);\r
474     }\r
475 \r
476     else if (unlikely(command == 0x2B))\r
477     {\r
478         // SEEK(10)\r
479         uint32_t lba =\r
480             (((uint32_t) scsiDev.cdb[2]) << 24) +\r
481             (((uint32_t) scsiDev.cdb[3]) << 16) +\r
482             (((uint32_t) scsiDev.cdb[4]) << 8) +\r
483             scsiDev.cdb[5];\r
484 \r
485         doSeek(lba);\r
486     }\r
487     else if (unlikely(command == 0x36))\r
488     {\r
489         // LOCK UNLOCK CACHE\r
490         // We don't have a cache to lock data into. do nothing.\r
491     }\r
492     else if (unlikely(command == 0x34))\r
493     {\r
494         // PRE-FETCH.\r
495         // We don't have a cache to pre-fetch into. do nothing.\r
496     }\r
497     else if (unlikely(command == 0x1E))\r
498     {\r
499         // PREVENT ALLOW MEDIUM REMOVAL\r
500         // Not much we can do to prevent the user removing the SD card.\r
501         // do nothing.\r
502     }\r
503     else if (unlikely(command == 0x01))\r
504     {\r
505         // REZERO UNIT\r
506         // Set the lun to a vendor-specific state. Ignore.\r
507     }\r
508     else if (unlikely(command == 0x35))\r
509     {\r
510         // SYNCHRONIZE CACHE\r
511         // We don't have a cache. do nothing.\r
512     }\r
513     else if (unlikely(command == 0x2F))\r
514     {\r
515         // VERIFY\r
516         // TODO: When they supply data to verify, we should read the data and\r
517         // verify it. If they don't supply any data, just say success.\r
518         if ((scsiDev.cdb[1] & 0x02) == 0)\r
519         {\r
520             // They are asking us to do a medium verification with no data\r
521             // comparison. Assume success, do nothing.\r
522         }\r
523         else\r
524         {\r
525             // TODO. This means they are supplying data to verify against.\r
526             // Technically we should probably grab the data and compare it.\r
527             scsiDev.status = CHECK_CONDITION;\r
528             scsiDev.target->sense.code = ILLEGAL_REQUEST;\r
529             scsiDev.target->sense.asc = INVALID_FIELD_IN_CDB;\r
530             scsiDev.phase = STATUS;\r
531         }\r
532     }\r
533     else if (unlikely(command == 0x37))\r
534     {\r
535         // READ DEFECT DATA\r
536         uint32_t allocLength = (((uint16_t)scsiDev.cdb[7]) << 8) |\r
537             scsiDev.cdb[8];\r
538 \r
539         scsiDev.data[0] = 0;\r
540         scsiDev.data[1] = scsiDev.cdb[1];\r
541         scsiDev.data[2] = 0;\r
542         scsiDev.data[3] = 0;\r
543         scsiDev.dataLen = 4;\r
544 \r
545         if (scsiDev.dataLen > allocLength)\r
546         {\r
547             scsiDev.dataLen = allocLength;\r
548         }\r
549 \r
550         scsiDev.phase = DATA_IN;\r
551     }\r
552     else\r
553     {\r
554         commandHandled = 0;\r
555     }\r
556 \r
557     return commandHandled;\r
558 }\r
559 \r
560 void scsiDiskPoll()\r
561 {\r
562     uint32_t bytesPerSector = scsiDev.target->liveCfg.bytesPerSector;\r
563 \r
564     if (scsiDev.phase == DATA_IN &&\r
565         transfer.currentBlock != transfer.blocks)\r
566     {\r
567         // Take responsibility for waiting for the phase delays\r
568         uint32_t phaseChangeDelayUs = scsiEnterPhaseImmediate(DATA_IN);\r
569 \r
570         int totalSDSectors =\r
571             transfer.blocks * SDSectorsPerSCSISector(bytesPerSector);\r
572         uint32_t sdLBA =\r
573             SCSISector2SD(\r
574                 scsiDev.target->cfg->sdSectorStart,\r
575                 bytesPerSector,\r
576                 transfer.lba);\r
577 \r
578         const int sdPerScsi = SDSectorsPerSCSISector(bytesPerSector);\r
579         const int buffers = sizeof(scsiDev.data) / SD_SECTOR_SIZE;\r
580         int prep = 0;\r
581         int i = 0;\r
582         int scsiActive __attribute__((unused)) = 0; // unused if DMA disabled\r
583         int sdActive = 0;\r
584 \r
585         // It's highly unlikely that someone is going to use huge transfers\r
586         // per scsi command, but if they do it'll be slower than usual.\r
587         uint32_t totalScsiBytes = transfer.blocks * bytesPerSector;\r
588         int useSlowDataCount = totalScsiBytes >= SCSI_XFER_MAX;\r
589         if (!useSlowDataCount)\r
590         {\r
591             scsiSetDataCount(totalScsiBytes);\r
592         }\r
593 \r
594         while ((i < totalSDSectors) &&\r
595             likely(scsiDev.phase == DATA_IN) &&\r
596             likely(!scsiDev.resetFlag))\r
597         {\r
598             int completedDmaSectors;\r
599             if (sdActive && (completedDmaSectors = sdReadDMAPoll(sdActive)))\r
600             {\r
601                 prep += completedDmaSectors;\r
602                 sdActive -= completedDmaSectors;\r
603             } else if (sdActive > 1)\r
604             {\r
605                 if ((scsiDev.data[SD_SECTOR_SIZE * (prep % buffers) + 510] != 0xAA) ||\r
606                     (scsiDev.data[SD_SECTOR_SIZE * (prep % buffers) + 511] != 0x33))\r
607                 {\r
608                     prep += 1;\r
609                     sdActive -= 1;\r
610                 }\r
611             }\r
612 \r
613             if (!sdActive &&\r
614                 (prep - i < buffers) &&\r
615                 (prep < totalSDSectors) &&\r
616                 ((totalSDSectors - prep) >= sdPerScsi) &&\r
617                 (likely(!useSlowDataCount) || scsiPhyComplete()) &&\r
618                 (HAL_SD_GetState(&hsd) != HAL_SD_STATE_BUSY)) // rx complete but IRQ not fired yet.\r
619             {\r
620                 // Start an SD transfer if we have space.\r
621                 uint32_t startBuffer = prep % buffers;\r
622                 uint32_t sectors = totalSDSectors - prep;\r
623                 uint32_t freeBuffers = buffers - (prep - i);\r
624 \r
625                 uint32_t contiguousBuffers = buffers - startBuffer;\r
626                 freeBuffers = freeBuffers < contiguousBuffers\r
627                     ? freeBuffers : contiguousBuffers;\r
628                 sectors = sectors < freeBuffers ? sectors : freeBuffers;\r
629 \r
630                 if (sectors > 128) sectors = 128; // 65536 DMA limit !!\r
631 \r
632                 // Round-down when we have odd sector sizes.\r
633                 if (sdPerScsi != 1)\r
634                 {\r
635                     sectors = (sectors / sdPerScsi) * sdPerScsi;\r
636                 }\r
637 \r
638                 for (int dodgy = 0; dodgy < sectors; dodgy++)\r
639                 {\r
640                     scsiDev.data[SD_SECTOR_SIZE * (startBuffer + dodgy) + 510] = 0xAA;\r
641                     scsiDev.data[SD_SECTOR_SIZE * (startBuffer + dodgy) + 511] = 0x33;\r
642                 }\r
643 \r
644                 sdReadDMA(sdLBA + prep, sectors, &scsiDev.data[SD_SECTOR_SIZE * startBuffer]);\r
645 \r
646                 sdActive = sectors;\r
647 \r
648                 if (useSlowDataCount)\r
649                 {\r
650                     scsiSetDataCount((sectors / sdPerScsi) * bytesPerSector);\r
651                 }\r
652 \r
653                 // Wait now that the SD card is busy\r
654                 // Chances are we've probably already waited sufficient time,\r
655                 // but it's hard to measure microseconds cheaply. So just wait\r
656                 // extra just-in-case. Hopefully it's in parallel with dma.\r
657                 if (phaseChangeDelayUs > 0)\r
658                 {\r
659                     s2s_delay_us(phaseChangeDelayUs);\r
660                     phaseChangeDelayUs = 0;\r
661                 }\r
662             }\r
663 \r
664             if (((prep - i) > 0) &&\r
665                 scsiFifoReady())\r
666             {\r
667                 int dmaBytes = SD_SECTOR_SIZE;\r
668                 if ((i % sdPerScsi) == (sdPerScsi - 1))\r
669                 {\r
670                     dmaBytes = bytesPerSector % SD_SECTOR_SIZE;\r
671                     if (dmaBytes == 0) dmaBytes = SD_SECTOR_SIZE;\r
672                 }\r
673 \r
674                 uint8_t* scsiDmaData = &(scsiDev.data[SD_SECTOR_SIZE * (i % buffers)]);\r
675                 scsiWritePIO(scsiDmaData, dmaBytes);\r
676 \r
677                 ++i;\r
678             }\r
679         }\r
680 \r
681         if (phaseChangeDelayUs > 0 && !scsiDev.resetFlag) // zero bytes ?\r
682         {\r
683             s2s_delay_us(phaseChangeDelayUs);\r
684             phaseChangeDelayUs = 0;\r
685         }\r
686 \r
687         if (scsiDev.resetFlag)\r
688         {\r
689             HAL_SD_Abort(&hsd);\r
690         }\r
691         else\r
692         {\r
693             // Wait for the SD transfer to complete before we disable IRQs.\r
694             // (Otherwise some cards will cause an error if we don't sent the\r
695             // stop transfer command via the DMA complete handler in time)\r
696             while (HAL_SD_GetState(&hsd) == HAL_SD_STATE_BUSY)\r
697             {\r
698                 // Wait while keeping BSY.\r
699             }\r
700         }\r
701 \r
702         HAL_SD_CardStateTypeDef cardState = HAL_SD_GetCardState(&hsd);\r
703         while (cardState == HAL_SD_CARD_PROGRAMMING || cardState == HAL_SD_CARD_SENDING) \r
704         {\r
705             cardState = HAL_SD_GetCardState(&hsd);\r
706          }\r
707 \r
708         // We've finished transferring the data to the FPGA, now wait until it's\r
709         // written to he SCSI bus.\r
710         while (!scsiPhyComplete() &&\r
711             likely(scsiDev.phase == DATA_IN) &&\r
712             likely(!scsiDev.resetFlag))\r
713         {\r
714             __disable_irq();\r
715             if (!scsiPhyComplete() && likely(!scsiDev.resetFlag))\r
716             {\r
717                 __WFI();\r
718             }\r
719             __enable_irq();\r
720         }\r
721 \r
722         if (scsiDev.phase == DATA_IN)\r
723         {\r
724             scsiDev.phase = STATUS;\r
725         }\r
726         scsiDiskReset();\r
727     }\r
728     else if (scsiDev.phase == DATA_OUT &&\r
729         transfer.currentBlock != transfer.blocks)\r
730     {\r
731         scsiEnterPhase(DATA_OUT);\r
732 \r
733         const int sdPerScsi = SDSectorsPerSCSISector(bytesPerSector);\r
734         int totalSDSectors = transfer.blocks * sdPerScsi;\r
735         uint32_t sdLBA =\r
736             SCSISector2SD(\r
737                 scsiDev.target->cfg->sdSectorStart,\r
738                 bytesPerSector,\r
739                 transfer.lba);\r
740         int i = 0;\r
741         int clearBSY = 0;\r
742         int disconnected = 0;\r
743 \r
744         int parityError = 0;\r
745         int enableParity = scsiDev.boardCfg.flags & S2S_CFG_ENABLE_PARITY;\r
746 \r
747         uint32_t maxSectors = sizeof(scsiDev.data) / SD_SECTOR_SIZE;\r
748 \r
749         static_assert(SCSI_XFER_MAX >= sizeof(scsiDev.data), "Assumes SCSI_XFER_MAX >= sizeof(scsiDev.data)");\r
750 \r
751         // Start reading and filling fifos as soon as possible.\r
752         // It's highly unlikely that someone is going to use huge transfers\r
753         // per scsi command, but if they do it'll be slower than usual.\r
754         // Note: Happens in Macintosh FWB HDD Toolkit benchmarks which default\r
755         // to 768kb\r
756         uint32_t totalTransferBytes = transfer.blocks * bytesPerSector;\r
757         int useSlowDataCount = totalTransferBytes >= SCSI_XFER_MAX;\r
758         if (!useSlowDataCount)\r
759         {\r
760             DWT->CYCCNT = 0; // Start counting cycles\r
761             scsiSetDataCount(totalTransferBytes);\r
762         }\r
763 \r
764         int lastWriteSize = 0;\r
765 \r
766         while ((i < totalSDSectors) &&\r
767             likely(scsiDev.phase == DATA_OUT) &&\r
768             likely(!scsiDev.resetFlag))\r
769             // KEEP GOING to ensure FIFOs are in a good state.\r
770             // likely(!parityError || !enableParity))\r
771         {\r
772             if (bytesPerSector == SD_SECTOR_SIZE)\r
773             {\r
774                 uint32_t maxXferSectors = SCSI_XFER_MAX / SD_SECTOR_SIZE;\r
775                 uint32_t rem = totalSDSectors - i;\r
776                 uint32_t sectors = rem < maxXferSectors ? rem : maxXferSectors;\r
777 \r
778                 uint32_t totalBytes = sectors * SD_SECTOR_SIZE;\r
779 \r
780                 if (useSlowDataCount)\r
781                 {\r
782                     scsiSetDataCount(totalBytes);\r
783                 }\r
784 \r
785                 lastWriteSize = sectors;\r
786                 HAL_SD_WriteBlocks_DMA(&hsd, i + sdLBA, sectors);\r
787                 int j = 0;\r
788                 int prep = 0;\r
789                 int sdActive = 0;\r
790                 uint32_t dmaFinishTime = 0;\r
791                 while (j < sectors && !scsiDev.resetFlag)\r
792                 {\r
793                     if (sdActive &&\r
794                         HAL_SD_GetState(&hsd) != HAL_SD_STATE_BUSY &&\r
795                         !sdIsBusy())\r
796                     {\r
797                         j += sdActive;\r
798                         sdActive = 0;\r
799                     }\r
800                     if (!sdActive && ((prep - j) > 0))\r
801                     {\r
802                         // Start an SD transfer if we have space.\r
803                         HAL_SD_WriteBlocks_Data(&hsd, &scsiDev.data[SD_SECTOR_SIZE * (j % maxSectors)]);\r
804 \r
805                         sdActive = 1;\r
806                     }\r
807 \r
808                     if (((prep - j) < maxSectors) &&\r
809                         (prep < sectors) &&\r
810                         scsiFifoReady())\r
811                     {\r
812                         scsiReadPIO(\r
813                             &scsiDev.data[(prep % maxSectors) * SD_SECTOR_SIZE],\r
814                             SD_SECTOR_SIZE,\r
815                             &parityError);\r
816                         prep++;\r
817                         if (prep == sectors)\r
818                         {\r
819                             dmaFinishTime = s2s_getTime_ms();\r
820                         }\r
821                     }\r
822                 \r
823                     if (i + prep >= totalSDSectors &&\r
824                         !disconnected &&\r
825                         (!parityError || !enableParity) &&\r
826                         s2s_elapsedTime_ms(dmaFinishTime) >= 180)\r
827                     {\r
828                         // We're transferring over the SCSI bus faster than the SD card\r
829                         // can write.  All data is buffered, and we're just waiting for\r
830                         // the SD card to complete. The host won't let us disconnect.\r
831                         // Some drivers set a 250ms timeout on transfers to complete.\r
832                         // SD card writes are supposed to complete\r
833                         // within 200ms, but sometimes they don't.\r
834                         // Just pretend we're finished.\r
835                         process_Status();\r
836                         clearBSY = process_MessageIn(0); // Will go to BUS_FREE state but keep BSY asserted.\r
837                         disconnected = 1;\r
838                     }\r
839                 }\r
840 \r
841                 if (scsiDev.resetFlag)\r
842                 {\r
843                     HAL_SD_Abort(&hsd);\r
844                 }\r
845                 else\r
846                 {\r
847                     while (HAL_SD_GetState(&hsd) == HAL_SD_STATE_BUSY) {} // Waits for DMA to complete\r
848                     if (lastWriteSize > 1)\r
849                     {\r
850                         SDMMC_CmdStopTransfer(hsd.Instance);\r
851                     }\r
852                 }\r
853 \r
854                 while (sdIsBusy() &&\r
855                     s2s_elapsedTime_ms(dmaFinishTime) < 180)\r
856                 {\r
857                     // Wait while the SD card is writing buffer to flash\r
858                     // The card may remain in the RECEIVING state (even though it's programming) if\r
859                     // it has buffer space to receive more data available.\r
860                 }\r
861 \r
862                 if (!disconnected && \r
863                     i + sectors >= totalSDSectors &&\r
864                     (!parityError || !enableParity))\r
865                 {\r
866                     // We're transferring over the SCSI bus faster than the SD card\r
867                     // can write.  All data is buffered, and we're just waiting for\r
868                     // the SD card to complete. The host won't let us disconnect.\r
869                     // Some drivers set a 250ms timeout on transfers to complete.\r
870                     // SD card writes are supposed to complete\r
871                     // within 200ms, but sometimes they don't.\r
872                     // Just pretend we're finished.\r
873                     process_Status();\r
874                     clearBSY = process_MessageIn(0); // Will go to BUS_FREE state but keep BSY asserted.\r
875                 }\r
876 \r
877                 // Wait while the SD card is writing buffer to flash\r
878                 // The card may remain in the RECEIVING state (even though it's programming) if\r
879                 // it has buffer space to receive more data available.\r
880                 while (sdIsBusy()) {}\r
881                 HAL_SD_CardStateTypeDef cardState = HAL_SD_GetCardState(&hsd);\r
882                 while (cardState == HAL_SD_CARD_PROGRAMMING || cardState == HAL_SD_CARD_RECEIVING) \r
883                 {\r
884                     // Wait while the SD card is writing buffer to flash\r
885                     // The card may remain in the RECEIVING state (even though it's programming) if\r
886                     // it has buffer space to receive more data available.\r
887                     cardState = HAL_SD_GetCardState(&hsd);\r
888                 }\r
889 \r
890                 i += sectors;\r
891             }\r
892             else\r
893             {\r
894                 // Well, until we have some proper non-blocking SD code, we must\r
895                 // do this in a half-duplex fashion. We need to write as much as\r
896                 // possible in each SD card transaction.\r
897                 // use sg_dd from sg_utils3 tools to test.\r
898 \r
899                 uint32_t rem = totalSDSectors - i;\r
900                 uint32_t sectors;\r
901                 if (rem <= maxSectors)\r
902                 {\r
903                     sectors = rem;\r
904                 }\r
905                 else\r
906                 {\r
907                     sectors = maxSectors;\r
908                     while (sectors % sdPerScsi) sectors--;\r
909                 }\r
910                 \r
911 \r
912                 if (useSlowDataCount)\r
913                 {\r
914                     scsiSetDataCount((sectors / sdPerScsi) * bytesPerSector);\r
915                 }\r
916 \r
917                 for (int scsiSector = i; scsiSector < i + sectors; ++scsiSector)\r
918                 {\r
919                     int dmaBytes = SD_SECTOR_SIZE;\r
920                     if ((scsiSector % sdPerScsi) == (sdPerScsi - 1))\r
921                     {\r
922                         dmaBytes = bytesPerSector % SD_SECTOR_SIZE;\r
923                         if (dmaBytes == 0) dmaBytes = SD_SECTOR_SIZE;\r
924                     }\r
925 \r
926                     scsiReadPIO(&scsiDev.data[SD_SECTOR_SIZE * (scsiSector - i)], dmaBytes, &parityError);\r
927                 }\r
928                 if (!parityError || !enableParity)\r
929                 {\r
930                     BSP_SD_WriteBlocks_DMA(&scsiDev.data[0], i + sdLBA, sectors);\r
931                 }\r
932                 i += sectors;\r
933             }\r
934         }\r
935 \r
936         // Should already be complete here as we've ready the FIFOs\r
937         // by now. Check anyway.\r
938         __disable_irq();\r
939         while (!scsiPhyComplete() && likely(!scsiDev.resetFlag))\r
940         {\r
941             __WFI();\r
942         }\r
943         __enable_irq();\r
944 \r
945         if (clearBSY)\r
946         {\r
947             enter_BusFree();\r
948         }\r
949 \r
950         if (scsiDev.phase == DATA_OUT)\r
951         {\r
952             if (parityError &&\r
953                 (scsiDev.boardCfg.flags & S2S_CFG_ENABLE_PARITY))\r
954             {\r
955                 scsiDev.target->sense.code = ABORTED_COMMAND;\r
956                 scsiDev.target->sense.asc = SCSI_PARITY_ERROR;\r
957                 scsiDev.status = CHECK_CONDITION;;\r
958             }\r
959             scsiDev.phase = STATUS;\r
960         }\r
961         scsiDiskReset();\r
962     }\r
963 }\r
964 \r
965 void scsiDiskReset()\r
966 {\r
967     scsiDev.dataPtr = 0;\r
968     scsiDev.savedDataPtr = 0;\r
969     scsiDev.dataLen = 0;\r
970     // transfer.lba = 0; // Needed in Request Sense to determine failure\r
971     transfer.blocks = 0;\r
972     transfer.currentBlock = 0;\r
973 \r
974     // Cancel long running commands!\r
975 #if 0\r
976     if (\r
977         ((scsiDev.boardCfg.flags & S2S_CFG_ENABLE_CACHE) == 0) ||\r
978             (transfer.multiBlock == 0)\r
979         )\r
980 #endif\r
981     {\r
982         sdCompleteTransfer();\r
983     }\r
984 \r
985     transfer.multiBlock = 0;\r
986 }\r
987 \r
988 void scsiDiskInit()\r
989 {\r
990     scsiDiskReset();\r
991 \r
992     // Don't require the host to send us a START STOP UNIT command\r
993     blockDev.state = DISK_STARTED;\r
994 }\r
995 \r